login contact us
RosConcert.com HomePage
    NEWS CENTRAL >> Hi-Tech

News Central


Hi-Tech

Квантовая математика поможет в поиске ключевых слов
5:30PM Monday, Apr 6, 2009
Нормальное случайное распределение, часто используемое в различных статистических моделях (в том числе и поиска слов). Изображение с сайта isutech.org

Нормальное случайное распределение, часто используемое в различных статистических моделях (в том числе и поиска слов). Изображение с сайта isutech.org
Испанские ученые создали новый алгоритм поиска в тексте ключевых слов, основанный на использовании теории случайных матриц, сообщает New Scientist. Работа ученых опубликована в журнале Physical Review E.

Самый простой метод поиска ключевых слов в тексте заключается в следующем. Чтобы определить, является ли слово ключевым, изучается частота его повторения в тексте. Затем частота того же слова определяется для некоторого базового текста, привязанного к изучаемому из некоторых сторонних соображений. Если частота в исходном тексте оказывается выше, чем в базовом, то слово признается ключевым.

В рамках нового исследования ученые предложили считать не только частоту вхождения слов, но их группировку. Ученые полагают, что более важные слова обычно группируются автором вместе, в тех частях текста, где он пытается донести основную мысль. При этом менее значимые слова оказываются более равномерно распределены в тексте.

Для описания данной идеи исследователи использовали так называемую теорию случайных матриц - раздел теории вероятности и статистики, занимающийся изучением случайных величин, которые принимают матричные значения. Оказалось, что многие математические методы данной теории представляется возможным применять к изучению текстов.

В качестве тестирования своего метода ученые предприняли попытку обнаружить ключевые слова в нескольких известных текстах на разных языках: английском, немецком, испанском, итальянском и латыни. Опыт оказался достаточно успешным. Например, в труде Эйнштейна, посвященном общей и специальной теориям относительности, в первую десятку ключевых слов новый метод поместил "поле" (field) и "гравитационный" (gravitational). В "Трех мушкетерах" Александра Дюма первую строчку оккупировала "миледи", а Атос оказался важнее д'Артаньяна. Полный список изучавшихся текстов доступен здесь.

Кроме этого исследователи провели тестирование нового метода в текстах, предварительно удалив из них пробелы. Результаты, по словам исследователей, указывают на то, что новый метод может применяться для изучения абстрактных массивов данных.

Создатели нового метода позиционируют его в качестве будущего метода для интернет-поиска. Специалисты в данной области, однако, пока настроены скептически. Они полагают, что, прежде чем можно будет говорить о практическом применении нового метода, необходимо провести сравнительное тестирование с существующими методами поиска.

По материалам lenta.ru
« « Вернуться       Далее » »
Другие новости по теме
  • Acer представила 11,6-дюймовый нетбук
  • В Северной Корее насчитали 20 тысяч мобильников
  • Японцы вдвое улучшили зеленые органические светодиоды
  • Intel предсказала трехкратный рост продаж интегрированной графики
  • IBM не смогла купить Sun
  • Sanyo выпустила видеокамеру для дайверов
  • IBM купит Sun за семь миллиардов долларов
  • Intel Atom в нетбуке заменили мобильной платформой Nvidia

    Далее » »   Digest | Архив »    
Смотрите также: Hi-Tech, Интернет, Hardware, SoftNews
News Central Home | News Central Resources | Portal News Resources | Help | Login
     
Phone Cards at ComFi Russian America Top. Рейтнг ресурсов Русской Америки. © 2026 RussianAMERICA Holding
All Rights Reserved • Contact