ДНК текста — набор его лексем?



Northwestern University и Университет Иллинойса запустили проект MONK.
MONK состоит из базы данных и программ, обнаруживающих повторяющиеся паттерны в текстах.
Программа отслеживает связки между отдельными словами и предложениями, частями речи и лексемами. Она также учитывает разнообразие диалектов.
Т.о. программа классификацирует тексты и вычислеяет вероятности появления лексем (например, по частоте появления слова в нескольких текстах вычислить вероятность появления текста в следующем).
С помощью этого инструмента можно получить своеобразную ДНК текста и понять, вокруг каких смыслов строится текст, кто в нём присутствует и какие действия и характеристики наиболее типичны.

оригинал


Добавить комментарий

Makeblock
  1. ок. Суть программы «один» — обработка статического изображения с применением специального фильтра, на выходе имеем обработанную картинку. Суть программы «два»…

  2. разумеется — реализация другая, но суть та же 🙂 можно реализовать Генератор и для фильма. используем считывание видео (OpenCV шаг…

  3. как это та же??? Тут рассматривается по сути своей просто фильтр для обработки картинок, а там механизм в который загружаешь…

  4. а вот теперь действительно генератор комиксов soft.compulenta.ru/666850/ Странички формируются на основании видеофильмов. программа анализирует видеофрагмент, идентифицирует говорящего героя, формирует панели…

2.0 2в1 3D AR Arduino DIY iPhone Дополненная реальность ИИ автоматизация бизнес будущее велосипед видео вопрос генератор датчик дизайн игра идея интернет интерфейс камера карта книга концепт лампа магазин магнит маркетинг машинное обучение микро-идея музыка поиск проект растение реклама рисунок робот робототехника сайт светодиод сервис сервомашинка стартап стимпанк тренд управление часы электричество