ДНК текста - набор его лексем?

Northwestern University и Университет Иллинойса запустили проект MONK.
MONK состоит из базы данных и программ, обнаруживающих повторяющиеся паттерны в текстах.
Программа отслеживает связки между отдельными словами и предложениями, частями речи и лексемами. Она также учитывает разнообразие диалектов.
Т.о. программа классификацирует тексты и вычислеяет вероятности появления лексем (например, по частоте появления слова в нескольких текстах вычислить вероятность появления текста в следующем).
С помощью этого инструмента можно получить своеобразную ДНК текста и понять, вокруг каких смыслов строится текст, кто в нём присутствует и какие действия и характеристики наиболее типичны.

оригинал

ок. Суть программы «один» — обработка статического изображения с применением специального фильтра, на выходе имеем обработанную картинку. Суть программы «два»…

разумеется — реализация другая, но суть та же 🙂 можно реализовать Генератор и для фильма. используем считывание видео (OpenCV шаг…

как это та же??? Тут рассматривается по сути своей просто фильтр для обработки картинок, а там механизм в который загружаешь…

суть та же )

а вот теперь действительно генератор комиксов soft.compulenta.ru/666850/ Странички формируются на основании видеофильмов. программа анализирует видеофрагмент, идентифицирует говорящего героя, формирует панели…

Идеи 2.0

ДНК текста — набор его лексем?

Добавить комментарий Отменить ответ