Есть список слов что-то около 50 тысяч, среди которых повторяющихся нет, но есть разные формы одних и тех же слов (веселый, веселая, веселые, невеселый и т.п.). Нужно сгруппировать их по смыслу, то есть выкинуть словоформы. Как это сделать? Интересует, прежде всего, поиск однокоренных слов. Короче, как написать алгоритм? Понимаю, что никак не обойтись без словарей, придется их составлять. Может быть, взять за основу словари ispell?
|