для начала неплохо бы найти эти сущностиЯ выдвинул гипотизу что их не ВСЕХ нужно искать, возможно, для решения конкретных задач нужна будет частичная идентификация. Но для работы системы в целом полная идентификация и/или отождествление не нужно. Например серкретарь в офисе принимает письма. Он/она его, у себя в голове классифицирует, запоминает контент. И уже по нему может принимать решение о дальнейших действиях, также он/она может его кратко пересказать.
ну вот есть (пока) freebase — вы что-то подобное хотите строить?Я до конца не понял что такое freebase. Но похоже — нет. Я хочу сделать что-то вроде базы данных, в которой лежат накопленные знания в виде естевсвенного текста. И по которой можно делать запросы. Например, мы собрали отзывы из интерент магазина. И в базу мы можем сделать запрос: «покажи все „агрессивные“ отзывы». Сисема сама пробежится по тектсу и выкатит результат. Или у нас есть база биографий (не формализированная), мы делаем запрос покажи нам все биографии оставленные людьми старше 30 лет и географами.
приведите пример текста, графа, и задачиЗа целевыми задачами я пришел сюда )
. Ты хочешь построить семантическую сеть «всего» ?Нет, это глупо. И ОЧЕНЬ не просто. Для решения ряда задач (на мою думку), достаточно вычлинить объекты (существительные) и зафиксировать какие над ними произвордятся действия. И уже можно по графу спрашивать информацию.
а у тебя какой то «сферический конь в вакууме» из которогоТак я за прояснением этой ситуации пришел сюда. Что бы выяснить что можно делать. ;)
хм. граф связей чего с чем?Сущьности описанные в тексте.
а главное, что потом с этим графом делать?Как по мне это очевидно, когда у нас есть построенная сеть. С «упорядоченными» зависимостями. То из этой структуры можно делать все что угодно. Главное что бы информации описанной в сети (графе) хватало на решение конкретной задачи :)
мабуть, шукає в словнику всі ці терміниНi, вiн поiхав у село)
error correctionКакие методики использовали? :)
И в каких проектах все это добро применяется? Для решения каких задач?
Можно конкретно что именно парсить? Я так пинимаю вы парсили по XPATH или прочим «предсказуемым» признакам?
Добрый день!
Я пытаюсь создать семантическую машину. То есть программу которая делает разбор текста по словам. И строит на основе разбора графы связей.
Так вот что бы не далать систему ради системы. Хочется найти практическю задачку (конкретную проблему в бизнесе которую можно монетезировать). Потому что система сложная и разрабатывать ее не так то просто. Хочется найти конкретные задачи так сказать для «промежуточного зароботка». Но вижу Вам явно будет не интересны мои наработки. Они еще в очень сыром виде. :)
По сути дела я только с апреля за машину взялся всерьез, до этого работал на другим проектом (для заказчика).
Владислав, я Вас услышал. Спасибо!
Вам что охота поговорить о изюминках? Или у вас есть реальные предложения?
Проект, я пишу один в свободное время. Паралельно осваивая С++. И что плохого в том, что я таскаю вместе с пилотным проектом nbproject? Вы можете мне аргументировать?
веб страница не доступна xD xD xDЭто вы про что?
настоятельно рекомендую вам поехать во Львов или Одессу — культурные и туристические центры Украины. Не жизнь а мечта. ЗП примерно такая же как и в Киеве.
Можно сказать и так. На самом деле граф (который строим мы ), это большая неоднородная сущность со большим количеством вариантов реализации. Это только назвается граф. Физически это компонент состоящий из множества узлов каждый узел имеет свою реализацию, но все узлы обладают единым интерфеймсом. Но это уже ньюансы реализации а не обсуждение идеи.
Що ви маєте на увазі під графом?Проанализированные данные. Граф — описывает зависимости, между объектами.
Например, virtual site assistant: по заданной базе товаров и их описаний построить бота, который отвечает на вопросы о наличии товара и их характеристиках.
Что то подобное мы и хотим реализовать. Только что бы брало не только по базе. Но еще и по отзывам, описаниям товаров, и просто статей на сайте. :)
Спасибо, посмотрю.
Так понимаю, это нужно для полноценного логического осмысления?
А зачем это программе? Программа анализирует структуру данных, и на основе построенного графа дает ответы. Если ответ не лежит в пространстве описуемым графом. То программа говорит «я не знаю решения.».
Поймите у меня нет ресурсов что бы пилить такой продукт на более чем 1 языке. С полноценным осмыслением естественного текста.
И даже на одном языке, нет возможности сделать полный разбор(всей «картины мира»).
Только узкие предметные области.
А в чем отличие граматтического разбора? О_о
Насколько я знаю в каждом языке есть глаголы, существительные, предлоги, прилагательные?
В чем проблема то?
Ведь подобные программы пишутся на основе семантических правил. А не «хардкода».
Спасибо! Посмотрю!
Потрібно робити синтаксичний аналізаторУ подобных задач лексический разбор и графопостроение — не самая сложная задача. При условии что:
Спасибо! То что нужно.