morfizm (morfizm) wrote,


Finally something radically new in the IR industry, aside from machine learned ranking, which (reportedly) works in production at large scale.
Hash signature-based matching phase of search, as a replacement for inverted index (document posting lists), with plenty of interesting optimizations.

Link to PDF from SIGIR 2017:

Video presentation:

// Bonus: it uses bloom filters ;)

Note: the topic in general is kinda advanced, but this particular video should be understandable for beginner programmers. Not recommended for general crowd, though.
Tags: in english, software engineering, work

  • Новости раскулачивания

    Бидон, в числе прочих налоговых ухудшений, предложил удвоить capital gain tax для сумм выше 1 млн в год. Моим личным планам это не мешает, т.к. я,…

  • Программисты - не боги?

    Мне знакомый сказал, что программисты - не боги. Это прям обидно, потому что с подразумеваемым квантором "всегда" это неверно. Программисты не боги…

  • Дети и инвестирование

    (Хоть и личная тема, пощу в public, чтобы легче было собрать полезный фидбек) Сегодня за прогулкой соединились воедино сразу несколько посылок в…

  • Post a new comment


    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.