описание звучит, словно из фантастической повести:
программа от Quid выбирает из сети информацию о патентах, новости, веб-странички фирм, лабораторий, организаций, их пресс-релизы, исследовательские публикации, списки сотрудников и заявленные трудовые вакансии, посты в твиттере и т. п. Из этих данных программа извлекает ключевые слова и фразы, способные охарактеризовать основные идеи проектов/стартапов и их принадлежность к той или иной области знаний/технологий.
Эти ключевые фразы (сотни на компанию) можно считать генами. Соответственно, оказывается, что у каждой компании — свой уникальный набор технологических генов, но притом у разных компаний может быть немало генов и общих.
Эти ключевые фразы можно считать генами (у каждой компании — свой уникальный набор).
При сопоставлении таких генетических кодов, обнаруживаются связи, ранее ускользавшие от внимания, а наглядная визуализация помогает найти закономерности.
Но с другой стороны — пример использования визуализации, как одного из мощных средств Data Mining-а 🙂
читать статью на мембране