Існує кілька тегсетів в різних академічних установах
Напевно кожна з цих установ вважає свій тегсет очевидним і гнучким. Розрізняють як мінімум два підходи до синтаксичного розбору — constituency parsing vs. dependency parsing. Мені здається, що у багатьох українських реченнях існує досить складна сукупність залежностей, маппити яку на універсальну світову виглядає дещо проблематичним. Але я не є професійним мовником / лінгвістом.
Працювати будуть лише лінгвісти
Good for them. Та якість такого підходу при відсутності якогось способу автоматичної верифікації викликає сумніви. С часом буде видніше, чого воно варте. У будь-якому разі виглядає як цікава і корисна спроба.
В корпусе русского языка для первого прохода использовали лингвистический процессор ЭТАП-3, что позволило осуществлять разметку в полуавтоматическом режиме. А что используете вы для украинского языка? Существуют ли какие-то стандарты языковой модели, которых лингвисты придерживаются при разметке? Где они опубликованы? Честно говоря, документация, расположенная по приведенной ссылке пока выглядит очень скромно.
Вся наша икспедиция Весь день бродила по лесу, Искала икспедиция Везде дорогу к Полюсу. И каждый в икспедиции Ужасно был бы рад Узнать, что значит Полюс И с чем его едят!
Почему-то обсуждение в этом топике напомнило мне строчки, написанные совсем в другое время, когда инженерам приходилось отрываться от своих проектов, отправляясь в колхоз:
Я иду поселком Соловьевка, Напеваю песню ни о чем. Я доволен. Вилы, как винтовка, На плече покоятся моем. А вокруг такая уйма сена, Для коров такая благодать, Что признаюсь, братцы, откровенно: Захотелось мне коровой стать. Чтоб меня кормили и поили, Попусту скотинку не браня, Чтобы руки женские доили Горячо и трепетно меня. В самом деле, это было б славно! А за все — такие пустяки! — Я давал бы молоко исправно И мычал могучие стихи.
бы согласиться быть перевезенным в штаты или европу на все готовое.
Насмешил.
Обрадовались тогда буржуины, записали поскорее Мальчиша-Плохиша в своё буржуинство и дали ему целую бочку варенья да целую корзину печенья.
На самом деле эмиграция — это серьезный стресс даже и для людей помоложе. Типа как черепаху пересадить в другой пруд с иным составом воды, флорой, фауной и пр.
В руках у программистов такие средства реанимации, какие медикам и не снились. Хотя не думаю, что информации достаточно для заключения о смерти. Конечно, в истории про клиента, единожды узревшего, как что-то как-то работает, концы с концами не сходятся. Но покопаться в этом спокойно, на трезвую голову, без эмоций, которые зашкаливают сразу в обе стороны — то ли это «гуано», то ли «вызов», не помешало бы. Сам я к такой работе отношусь нормально, но наверное кому-то она может быть сильно не по кайфу. Ну, не сделает один, может, сделает кто-то другой.
Если я считаю что это вызов, то этим обрекаю себя на овертаймы ... А если считаю что это мне не надо и нужно поработать «на отвали» ... то значит я халтурю
Ну, мне вообще-то не слишком импонируют оба эти подхода. Тебе же требуется оживить систему. Допустим, по аналогии, что ты дежурный врач, и к тебе в реанимацию поступил очередной пациент. Это что, «вызов», или это «тебе не надо»?
Твое раздражение можно понять и посочувствовать, и все же, как мне кажется, оно не продуктивно. В реальном мире никто никому ничего не должен, зато от каждого свинства можно отрезать кусочек ветчины. Наивно ждать от потерпевшего указаний, где искать преступника, хотя это сильно облегчило бы работу дознавателей. А так одни юристы защищают диссертации, совершенствуя методологические patterns, а другие следаки ищут настоящих фриков в реальных обстоятельствах, и именно к их услугам приходится прибегать в сложных случаях. Аналогично больной не всегда скажет врачу, где у него недуг, а медицинские карты пациентов полны пропусков, ошибок и прямого вранья, в чем пришлось убедиться разработчикам систем медицинской диагностики, основанных на этих данных. У тебя тут все перемешано — технические аспекты проблемы, человеческий фактор — отношения разработчик — менеджер — клиент, эмоциональный фактор — волна раздражения, которую у тебя вызывает эта ситуация. Но нас же учили декомпозиции задачи, то есть выделять отдельные подзадачи, а не смешивать все в один ком. А в психическом плане нас разрушает как раз само это раздражение, а совсем не левые фреймворки, анти-паттерны и несовершенство каких-то неизвестных нам программистов. По твоему описанию это типичный исследовательский проект, что на мой взгляд интереснее, чем клепать стандартные страницы по рекомендованной методике. Всякое исследование в числе прочих характеризуют следующие черты:
— повышенные требования к профессионализму разработчика — существенный риск получить отрицательный результат, что впрочем, сильно зависит от пункта один — плохо предсказуемые затраты временных и прочих ресурсов, равно как сам конечный итог — эмоциональное восприятие объекта исследований вредит результату. Глупо презирать разработчиков оригинального кода — на все есть свои причины, но сейчас это твои основные помощники и подсказчики. — и так далее, ты и сам знаешь все не хуже меня
Получается, дело не в самой задаче, а в том, что тебя принуждают ее решать в некомфортных стрессовых условиях, спекулируя на том, что иначе ты не так крут, как полагается быть украинскому синьору по представлениям невежд. В этой ситуации, как мне кажется, есть по крайней мере два варианта:
1). Открыто признать, что ты не так крут, заявив, что по твоим профессиональным оценкам задача потребует существенно больше времени и / либо иных ресурсов. Я сам прибегал к такому не один раз и как правило получал желаемое время либо иную помощь, например в форме усилий других разработчиков по параллельному ведению всяких периферийных работ, типа создания виртуальных машин для необходимого тестового окружения и иной тому подобной лабуды.
2). Спокойно исследовать в свое удовольствие, никак себя не перегружая, и пусть оно займет то время, которого потребует, либо какая-то из заинтересованных сторон ни сделает свой ход для изменения ситуации. Нередко пункт 2 оказывается на практике эквивалентен пункту 1 за исключением тонны словоблудия на тему того, как что «должно быть» по представлениям разных сторон. :)
В приведенном объеме с таким не приходилось сталкиваться, но если частично, то случалось наверное с каждым, кто работает достаточно долго. Как и было сказано, можно пытаться танцевать от тестов, хотя и не факт, что если заработают тесты, то заработает и вся система. Если тестов много, они наверное как-то структурированы, и можно поискать там ниточку, за которую тянуть. В каждом отдельном тесте хорошо то, что если он валится, это обычно указывает на какое-то противоречие — остается лишь понять, как его устранить. Концептуально это похоже на tdd. Конечно, следуя за ниточкой, глупо игнорировать исходный текст и как источник информации, и как средство модификации системы, хотя и пытаться читать его весь сверху вниз тоже глупо. По ходу дела станет понятно, с чем можно справиться, меняя конфигурационные установки, а с чем проще совладать, меняя код. Заодно могут возникнуть идеи модернизации отдельных блоков. Важно как-то продраться к конечному результату, не углубляясь в боковые ветви этого лабиринта. И уж глупее всего, как мне кажется, «втихаря делать новую версию», ибо проблема не в коде, а в отсутствии понимания системы, без которого новый код рискует стать таким же монстром, как и старый, если не хуже того. Что до свечей, гороскопов и прочей эзотерики, мне кажется, надежды мало. В крайнем случае, можно пригласить попа, чтоб окропил сервер святой водой и выгнал из офиса пару бесов.
Так исправлять это наша работа, даже если накосячил кто-то другой. При чем тут ответственность? У врачей есть страхование на случай медицинской ошибки. Но вот, например, список знаменитых багов: List of software bugs. При этом отсутствует список ответивших за них программистов, потому что так это не работает.
Граматичний словник для українського Natural Language Processing
Граматичний словник для українського Natural Language Processing
В корпусе русского языка для первого прохода использовали лингвистический процессор ЭТАП-3, что позволило осуществлять разметку в полуавтоматическом режиме. А что используете вы для украинского языка? Существуют ли какие-то стандарты языковой модели, которых лингвисты придерживаются при разметке? Где они опубликованы? Честно говоря, документация, расположенная по приведенной ссылке пока выглядит очень скромно.
Граматичний словник для українського Natural Language Processing
А нет ли где в доступе синтаксически размеченного корпуса украинского языка наподобие ruscorpora?
Тема не актуальна. Можна видалити
Тема не актуальна. Можна видалити
Тема не актуальна. Можна видалити
Система обнаружения сидящего за столом
A Survey of Human-Sensing
Петиція — Скасувати не профільні предмети у ВНЗ (добавлен аудио монолог)
Работа в стойле — что это значит?
Почему-то обсуждение в этом топике напомнило мне строчки, написанные совсем в другое время, когда инженерам приходилось отрываться от своих проектов, отправляясь в колхоз:
Александр Житинский, «Сено-солома».Где вы ищете девушек? ч. 4 — «Новая надежда»
Старый ящик — новый ящик, белый ящик — черный ящик. Теорвер или эзотерика?
Старый ящик — новый ящик, белый ящик — черный ящик. Теорвер или эзотерика?
В руках у программистов такие средства реанимации, какие медикам и не снились. Хотя не думаю, что информации достаточно для заключения о смерти. Конечно, в истории про клиента, единожды узревшего, как что-то как-то работает, концы с концами не сходятся. Но покопаться в этом спокойно, на трезвую голову, без эмоций, которые зашкаливают сразу в обе стороны — то ли это «гуано», то ли «вызов», не помешало бы. Сам я к такой работе отношусь нормально, но наверное кому-то она может быть сильно не по кайфу. Ну, не сделает один, может, сделает кто-то другой.
Старый ящик — новый ящик, белый ящик — черный ящик. Теорвер или эзотерика?
Старый ящик — новый ящик, белый ящик — черный ящик. Теорвер или эзотерика?
Твое раздражение можно понять и посочувствовать, и все же, как мне кажется, оно не продуктивно. В реальном мире никто никому ничего не должен, зато от каждого свинства можно отрезать кусочек ветчины. Наивно ждать от потерпевшего указаний, где искать преступника, хотя это сильно облегчило бы работу дознавателей. А так одни юристы защищают диссертации, совершенствуя методологические patterns, а другие следаки ищут настоящих фриков в реальных обстоятельствах, и именно к их услугам приходится прибегать в сложных случаях. Аналогично больной не всегда скажет врачу, где у него недуг, а медицинские карты пациентов полны пропусков, ошибок и прямого вранья, в чем пришлось убедиться разработчикам систем медицинской диагностики, основанных на этих данных. У тебя тут все перемешано — технические аспекты проблемы, человеческий фактор — отношения разработчик — менеджер — клиент, эмоциональный фактор — волна раздражения, которую у тебя вызывает эта ситуация. Но нас же учили декомпозиции задачи, то есть выделять отдельные подзадачи, а не смешивать все в один ком. А в психическом плане нас разрушает как раз само это раздражение, а совсем не левые фреймворки, анти-паттерны и несовершенство каких-то неизвестных нам программистов. По твоему описанию это типичный исследовательский проект, что на мой взгляд интереснее, чем клепать стандартные страницы по рекомендованной методике. Всякое исследование в числе прочих характеризуют следующие черты:
— повышенные требования к профессионализму разработчика
— существенный риск получить отрицательный результат, что впрочем, сильно зависит от пункта один
— плохо предсказуемые затраты временных и прочих ресурсов, равно как сам конечный итог
— эмоциональное восприятие объекта исследований вредит результату. Глупо презирать разработчиков оригинального кода — на все есть свои причины, но сейчас это твои основные помощники и подсказчики.
— и так далее, ты и сам знаешь все не хуже меня
Получается, дело не в самой задаче, а в том, что тебя принуждают ее решать в некомфортных стрессовых условиях, спекулируя на том, что иначе ты не так крут, как полагается быть украинскому синьору по представлениям невежд. В этой ситуации, как мне кажется, есть по крайней мере два варианта:
1). Открыто признать, что ты не так крут, заявив, что по твоим профессиональным оценкам задача потребует существенно больше времени и / либо иных ресурсов. Я сам прибегал к такому не один раз и как правило получал желаемое время либо иную помощь, например в форме усилий других разработчиков по параллельному ведению всяких периферийных работ, типа создания виртуальных машин для необходимого тестового окружения и иной тому подобной лабуды.
2). Спокойно исследовать в свое удовольствие, никак себя не перегружая, и пусть оно займет то время, которого потребует, либо какая-то из заинтересованных сторон ни сделает свой ход для изменения ситуации. Нередко пункт 2 оказывается на практике эквивалентен пункту 1 за исключением тонны словоблудия на тему того, как что «должно быть» по представлениям разных сторон. :)
Старый ящик — новый ящик, белый ящик — черный ящик. Теорвер или эзотерика?
В приведенном объеме с таким не приходилось сталкиваться, но если частично, то случалось наверное с каждым, кто работает достаточно долго. Как и было сказано, можно пытаться танцевать от тестов, хотя и не факт, что если заработают тесты, то заработает и вся система. Если тестов много, они наверное как-то структурированы, и можно поискать там ниточку, за которую тянуть. В каждом отдельном тесте хорошо то, что если он валится, это обычно указывает на какое-то противоречие — остается лишь понять, как его устранить. Концептуально это похоже на tdd. Конечно, следуя за ниточкой, глупо игнорировать исходный текст и как источник информации, и как средство модификации системы, хотя и пытаться читать его весь сверху вниз тоже глупо. По ходу дела станет понятно, с чем можно справиться, меняя конфигурационные установки, а с чем проще совладать, меняя код. Заодно могут возникнуть идеи модернизации отдельных блоков. Важно как-то продраться к конечному результату, не углубляясь в боковые ветви этого лабиринта. И уж глупее всего, как мне кажется, «втихаря делать новую версию», ибо проблема не в коде, а в отсутствии понимания системы, без которого новый код рискует стать таким же монстром, как и старый, если не хуже того. Что до свечей, гороскопов и прочей эзотерики, мне кажется, надежды мало. В крайнем случае, можно пригласить попа, чтоб окропил сервер святой водой и выгнал из офиса пару бесов.
А вы разрабатываете на продакшине?
Так исправлять это наша работа, даже если накосячил кто-то другой. При чем тут ответственность? У врачей есть страхование на случай медицинской ошибки. Но вот, например, список знаменитых багов: List of software bugs. При этом отсутствует список ответивших за них программистов, потому что так это не работает.
А вы разрабатываете на продакшине?
чем?
А вы разрабатываете на продакшине?
А вы разрабатываете на продакшине?
То есть никаких рисков в случае отказа нет? Тогда продукт лучше выбросить, а разработчиков отпустить, раз уж и сами хотят уволиться. :)
А вы разрабатываете на продакшине?
А что это значит «сделают крайним» и как это в случае чего поможет компенсировать потерю клиента?