Стемминг (Stemming) – технология работы поисковой системы, позволяющая произвести морфологический анализ ключевого слова и выделить грамматическую основу, отделяя окончания, суффиксы и предлоги. Задачей стемминга является расширение поисковой базы с учетом словоформ, чтобы в результате предоставить наиболее точные ответы на запрос пользователя.
Программа-анализатор стемминга Mystem
Технология морфологического поиска активно применяется в отечественной поисковой системе Яндекс, разработчики которой создали специальную программу Mystem с бесплатной лицензией для некоммерческого применения.
На рынке представлены версии программы для популярных платформ Windows, Mac OS X, FreeBSD, Linux.
Кроме собственно выделения в ключевом слове базовой формы, анализатор определяет и другие параметры – частотность употребления, некоторые дополнительные характеристики слова в русском языке.
В программе анализаторе Mystem интегрирован глоссарий часто употребляемых слов, а в версии 1.0 доступная функция морфологического анализа ключевых фраз на английском языке.
Применение стеммингового принципа в поисковых машинах позволяет веб-мастерам расширить семантическое ядро сайта за счет использования словоформ поисковых запросов и тем самым без особых затрат значительно повысить органический трафик.