Системное программирование должны знать и понимать все. Я не раз в своей работе исспользовал знания, которые изложены в этом курсе. Обратите внимание, что это не курс «Создание операционных систем».
как бы по-вашему выглядела хорошая программа подготовки бакалавров, какие курсы бы там читали и сколько лет бы это занимало?Это долгая тема. Есть много вполне рабочих вариантов, ничего изобретать не нужно. Да, и наша программа нормальная (она требует корректировки максимум процентов на 30% — я об этом писал в предыдущей колонке 4 года назад: по большому счету, мы учим примерно те же вещи, что и в Стэнфорде). Вопрос тут скорее в практике ее реализации.
как вы относитесь к работающим (на фултайме или парт-тайме) студентам?Если есть возможность, то лучше не работать, а учиться (больше такой возможности не будет). Но, конечно, если обучающая среда более-менее нормальная (т.е. есть преподаватели и коллеги-студенты, с которыми интересно, минимизированна бессмысленная трата времени).
Этот «мем», к сожалению, частично имеет под собой вполне реальные основания. Зачастую сами профессора не могут объяснить, зачем нужен их предмет, а просто отвечают абстрактными вещами типа «ну, вы должны быть всесторонне развитыми специалистами», или «Это же ВЫСШЕЕ образование», или «Не нравится — идите работайте».
Ну, вот я рассказываю абсолютно практичные вещи, тем не менее, они также почти никому не интересны.
та ну, я на ФІОТі майже ніякої ролі не грав
Вот слайды: www.slideshare.net/...tural-language-processing
Не знаю, кто, что ищет — может и так. Как по мне, и здесь возможностей хватает (я бы даже сказал, что если здесь родисля, то возможностей больше)
Половина идет работать в ИТ-индустрию: разработчиками, аналитиками, QA, администраторами, сейлзами, в конце концов, а 50% продолжают искать себя
Вы не владеете реальными данными. Во всяком случае, на кафедре ФИВТа КПИ, где я преподаю, за бугор из 100 студентов потока уезжает обычно максимум
Роман, покажите этих ученых, которых выпускают вузы. К сожалению, таких единицы, поскольку научные школы в Украине в IT практически разрушены. Я бы сказал, что проблема в другом: больше половину выпускников не готовы и не хотят работать по специальности (ни инженерами, ни учеными). А все это закладывается еще на уровне неверных ожиданий при поступлении и коррумпированной системой отбора (взятки, льготы и т.п.)
Мы используем все NLP-подходы и модели, которые дают какой-то результат (можно посмотреть материалы Курсеровских лекций по NLP — там много всего описано).
Самая главная проблема — это отсутствие качественных данных (в нашей области — корпусов), и решаем мы ее разными способами: ищем по миру, готовим сами.
Над движком у нас уже работает больше 10 человек, а, вообще, компания продуктовая, поэтому есть полный спектр людей: от поддержки пользователей до пиарщиков.
Сотрудников ищем обычными методами, только это занимает много времени, поскольку у нас высокие требования, а хорошие специалисты в основном работают на хороших работах. Но берем иногда и начинающих, если это будущие гении, а у нас есть для них задачи. Первых специалистов мы не искали — часть из разработчиков этим занималась с самого начала. Благо, у нас про эти вещи на базовом уровне рассказывают в университетах, а дальше опен-сорс и научные статьи никто не отменял.
Про обучение специалистов: на этом уровне каждый должен сам уметь учиться. Компания, впрочем, помогает, если нужно. Например, может отправить на конференцию по теме или оплатить какой-то курс.
На бизнес вопросы я авторитетно ответить не смогу.
Есть еще довольно много компаний, которые тем или иным боком имеют отношение к ML/AI/NLP/...
Например, секретная компания Zoral Labs много таких проектов делала и продолжает делать. Выходцы из Viewdlа организовались в Video Gorillas, YouScan пытаются что-то делать, Jooble вот ищет себе спеца по анализу данных. Materialise, CyberVision, Cupid Plc, Kodisoft, Codeminders, Polyteda, ISS тоже какое-то отношение имеют к околоматематическим вещам. У всех больших аутсорсеров есть какие-то проекты.
Только почему-то все стыдятся об этом говорить и прячутся за NDA, как будто если кто-то узнает, что вы используете в работе формулу Байеса, то сразу прозреет и создаcт конкурента...
Наше помещение называется «лаунж» — видимо, это не весь чердак.
Но, учитывая что зарегистрировалось сейчас как раз 30 человек и кто-то обязательно не прийдет, я думаю, мы вполне влезаем.
конечно, smartme регулярно привозят
за следующме 15 лет маятник успеет качнуться еще минимум раза 2
(предыдущие события также анонсировались здесь, а также делали отчеты)
Все видео с kyivfprog — тут: www.youtube.com/...C3A13C646B5EEEB
Тематические сайты слишком мелки, но вот что-то вроде Hacker News для русского контента, возможно, и стоило было бы сделать. Кстати, для платформы ДОУ это могла бы быть возможность выйти за пределы Украины...
Я тут со всеми на ты по разным причинам.
Чего-то мне кажется, что причина одна — врожденное хамство.
Это просто был наглядный пример отсуствия драйвера к БД, и например поддержки map reduce написать будет очень нетривиально.
А можно список клиентов HBase на разных языках? А то я чего-то не нашел. Что касается MapReduce, то это ж Hadoop делает, причем тут HBase?
Утверждается что твоя либа матчит по фичам jedis?
В принципе, по некоторым даже превосходит.
досвидания, у тебя тоже ДЗ нарисовалось — поработать над качеством аргументов.
На таком уровне дискуссии в этом нет особого смысла. Ответы были для третьих лиц, которые это прочитают без интереса потроллить.
Что касается HBase, то пока не было необходимости с ней работать, так что вопрос не ко мне.
Та нет, мне интереснее деливерить какие то результаты вместо того что бы увязать в деталях.
Деливерить — это в смысле рожать?
Вопрос не в том, чтобы их парсить, а в том, что S-выражения выражают деревья разбора, с которыми можно потом очень легко работать, т.е. обрабатывать результаты парсинга, который уже получен (т.е. цель переплюнуть работы профессоров мы себе не ставим, а хотим ее использовать для того, чтобы что-то наделиверить).Мне кажется либу для парсинга s expressions написать на 3 порядка проще чем драйвер к БД или враппер клиент к ntlk.
Что касается написания враппера к nltk, то в этом нет необходимости. Во-первых, потому, что если делать что-то серьезное, то nltk, как и любая другая библиотека (кстати, для Лиспа есть nlp-библиотека langutils, ссылка на которую я дал в презентации) не даст исчерпывающего и самого лучшего во всех сферах на данный момент решения. В лучшем случае, удастся взять кусок из одной библиотеки, кусок из другой. Во-вторых, потому что написать простенький сервер, который будет слушать запросы через сокет, скармливать их парсеру из nltk, или же opennlp, или же какому-нибудь мало известному, но самому быстрому, написанному на, скажем, С++,— дело пары дней работы. Да еще и +10 к scalability.
Debian Shootout — это, конечно, самое прикольное место, где можно почитать код на разных языках, но не самое показательное, скорее наоборот. Но если интересно в этом покопаться больше, вот хорошая ссылка: swizard.livejournal.com/159125.htmlЯ вообще к чему всю эту тему завел, я в лиспе чесно говоря не сильно разбираюсь, на уровне факториалов и хелло ворлдов. Поэтому что бы понять действительно ли лисп продуктивнее я смотрю чужой код, например: shootout.alioth.debian.org/u32/lisp.php и вот оказывается что лисп требует писать больше буков чем многословная джава, т.е. он вообще не конкурент например скале с ее батарейками, и при этом теряет в производительности и экосистеме библиотек и непонятно в чем профит. Мне было бы интереснее посмотреть решения конкретных задач на лисп, которые с трудом решаются на джаве. s expressions как я уже написал не катит.
В общем, домашнее задание у тебя есть. Дальнейший разговор в формате пузомерки и тыканья мне не очень интересен, поэтому буду продолжать, когда ты подпишешься под комментариями реальным именем.
Мне, на самом деле, интересно преподавать — есть такая склонность, — что не значит, что это у меня хорошо получается. С другой стороны, в чем-то вы правы: когда я думал о том, чтобы пойти преподавать, картина, в целом, была понятна. Просто, было больше времени.
А перспективы улучшения ситуации есть, точнее есть предпосылки, которые так или иначе реализуются. Конечно, те, кому не интересно, могут не участвовать в этом процессе — мне было интересно 7 лет назад и, в принципе, интересно сейчас...