Ноя
IBM сделает самообучающийся переводчик
Следуя заветам Барака Обамы (разработка средств машинного перевода недавно была упомянута в числе главных целей инновационной стратегии администрации президента Обамы и на эти цели вроде как выделен неплохой бюджет), корпорация IBM в очередной раз взялась за машинный перевод.
Самообучающаяся программа автоматического перевода n.Fluent в фоновом режиме позволит переводить документы, веб-страницы и даже реплики в IM-приложениях.
Система будет доступна на компьютерах и смартфонах.
В тестировании, направленном на улучшение качества перевода, принимают участие около 400 тысяч сотрудников компании. Тестировщики определяют неверные варианты перевода и уведомляют об этом руководителей проекта. Во время тестирования летом этого года группе сотрудников компании удалось исправить около 1,3 млн. слов.
Уже сейчас n.Fluent используется внутри компании.
Применение краудсорсинга — участия в разработке массы добровольных помощников — позволило резко ускорить наполнение базы данных программы. Корпорация организует еще несколько подобных массовых проектов для расширения базы и повышения качества перевода. Методы краудсорсинга используются и в разработке пакетов DigiCapE и Agora, призванных облегчить процессы транскрипции видеозаписей, разметки, синхронизации субтитров и тому подобные задачи.
Похожие записи:





> исправить около 1,3 млн. слов
В оригинале [1]: crowdsourced approximately 1.3 million words. Внесли методом краудсорсинга?
[1] http://www.google.com/search?q=n.Fluent+1.3+mil...
По-моему, краудсорсинг здесь для красного словца, потому что модно. Просто совместная работа многих людей. Внести методом краудсорсинга — это как-то не понятно, как будто краудсорсинг — что-то типа машинного перевода.
Честно говоря, я скомпилировал новость из разных русских источников, а не переводил.
Согласно [1], это машинный перевод, откорретированный краудсорсингом.
[1] «*Crowdsourcing — the collective power of bilingual IBMers*»,
http://www.research.ibm.com/social/projects_nfl...
2009/11/27 Disqus <>
Ну, по-русски нельзя сказать, что он «откорректирован краудсорсингом». Он откорректирован людьми.
Определение краудсорсинга от IBM забавно. Также я могу написать, что краудсорсинг — мощь двуязычных океевцев.
2009/11/28 Disqus <>
Нет, конечно
. Но всё равно определение смешное. Краудсорсинг — мощь двуязычных майксрософтцев, гуглеров, может даже яндексоидов
.
Людей, просто людей.
Я не филолог, но поспорить на тему русского языка люблю, как и все
.
Краудсорсинг — это совместная работа, вроде. Совместная работа — метод чего? «Внесли методом совместной работы» — точно не по-русски.
Я благодаря Вашему комментарию задумался в чём отличие совместной работы от краудсорсинга и есть ли вообще это отличие.
Помните, как Том Сойер покраску забора организовал? «Работа — это то, что человек обязан делать».
Crowdsourcing is a distributed problem-solving and production model. и т.д., [1]
[1] http://en.wikipedia.org/wiki/Crowdsourcing
Из этой статьи, на самом деле, тоже мало что понятно. Там ещё не к месту упоминается аутсорсинг. Это тот редкий случай, когда в русской Википедии статья лучше.
Сейчас я понял, что такое краудсорсинг в случае IBM — есть проблема, и добровольцы и энтузиасты внутри компании её решают (похоже, бесплатно). Тем не менее, на мой взгляд «откорректированный краудсорсингом» — неправильно. Как неправильно, например, дерево распиленное пилением.
> краудсорсинг в случае IBM
> — есть проблема, и добровольцы и энтузиасты внутри
> компании её решают (похоже, бесплатно).
Отсюда рукой подать до общего определения краудсорсинга: удалите «в случае IBM» и «внутри компании», добавьте «или за деньги». Да, и еще: проблему, как правило, ставит заинтересованное лицо, он же обеспечивает технические средства для взаимодействия.
> Тем не менее, на мой взгляд «откорректированный
> краудсорсингом» — неправильно. Как неправильно,
> например, дерево распиленное пилением.
«распиленное пилением» — тавтология, у меня такого не было — не вполне удачный пример. «откорректированный краудсорсингом» — правильно. Как правильно, например, обработанный резанием, получаемый фрезерованием, загерметизированный давлением.
Пример у меня неудачный, это точно. Впрочем «обработанные резанием» — тоже что-то странное.
Мои претензии основаны, в общем-то, на личных ощущениях. «Методом краудсорсинга» для меня звучит неправильно. Но лучше, чем «откорректированный краудсорсингом» — тут вообще кажется, что краудсорсинг — какой-то аппарат для корректировки, либо такой особый способ корректирования (а краудсорсниг — это ведь больше, чем корректирование), либо программа для корректирования.
Да, в данном случае краудсорсинг — это такой особый способ: есть проблема — не вполне адекватный машинный перевод — и добровольцы и энтузиасты её решают путем корректирования перевода.
[...] IBM сделает самообучающийся переводчик, [...]
[...] имевшие наработки в этой области, подсуетились, и выпускают разнообразные новинки. Европа тоже не дремлет и выделает щедрые гранты на [...]
>Впрочем «обработанные резанием» — тоже что-то странное.
Вполне нормальный руский технический язык. Почитайте, например, ГОСТы. Там найдёте упоминания деталей, поверхностей, элементов и т.п., «обработанных (или обрабатываемых) резанием», «обработанных шлифованием», «обработанных давлением» и т.д.
Есть многое на свете, друг Денисио...