27
Ноя

IBM сделает самообучающийся переводчик

ibmСледуя заветам Барака Обамы (разработка средств машинного перевода недавно была упомянута в числе главных целей инновационной стратегии администрации президента Обамы и на эти цели вроде как выделен неплохой бюджет), корпорация IBM в очередной раз взялась за машинный перевод.

Самообучающаяся программа автоматического перевода n.Fluent в фоновом режиме позволит переводить документы, веб-страницы и даже реплики в IM-приложениях.

Система будет доступна на компьютерах и смартфонах.

В тестировании, направленном на улучшение качества перевода, принимают участие около 400 тысяч сотрудников компании. Тестировщики определяют неверные варианты перевода и уведомляют об этом руководителей проекта. Во время тестирования летом этого года группе сотрудников компании удалось исправить около 1,3 млн. слов.

Уже сейчас n.Fluent используется внутри компании.

Применение краудсорсинга — участия в разработке массы добровольных помощников — позволило резко ускорить наполнение базы данных программы. Корпорация организует еще несколько подобных массовых проектов для расширения базы и повышения качества перевода. Методы краудсорсинга используются и в разработке пакетов DigiCapE и Agora, призванных облегчить процессы транскрипции видеозаписей, разметки, синхронизации субтитров и тому подобные задачи.

Похожие записи:



16 комментариев to “IBM сделает самообучающийся переводчик”

  1. rns123:

    > исправить около 1,3 млн. слов
    В оригинале [1]: crowdsourced approximately 1.3 million words. Внесли методом краудсорсинга?

    [1] http://www.google.com/search?q=n.Fluent+1.3+mil...

  2. По-моему, краудсорсинг здесь для красного словца, потому что модно. Просто совместная работа многих людей. Внести методом краудсорсинга — это как-то не понятно, как будто краудсорсинг — что-то типа машинного перевода.
    Честно говоря, я скомпилировал новость из разных русских источников, а не переводил.

  3. rns123:

    Согласно [1], это машинный перевод, откорретированный краудсорсингом.

    [1] «*Crowdsourcing — the collective power of bilingual IBMers*»,
    http://www.research.ibm.com/social/projects_nfl...

    2009/11/27 Disqus <>

  4. Ну, по-русски нельзя сказать, что он «откорректирован краудсорсингом». Он откорректирован людьми.
    Определение краудсорсинга от IBM забавно. Также я могу написать, что краудсорсинг — мощь двуязычных океевцев.

  5. rns123:

    2009/11/28 Disqus <>

  6. Нет, конечно :-) . Но всё равно определение смешное. Краудсорсинг — мощь двуязычных майксрософтцев, гуглеров, может даже яндексоидов :-) .

  7. rns123:

    Людей, просто людей. :)

  8. Я не филолог, но поспорить на тему русского языка люблю, как и все :-) .
    Краудсорсинг — это совместная работа, вроде. Совместная работа — метод чего? «Внесли методом совместной работы» — точно не по-русски.
    Я благодаря Вашему комментарию задумался в чём отличие совместной работы от краудсорсинга и есть ли вообще это отличие.

  9. rns123:

    Помните, как Том Сойер покраску забора организовал? «Работа — это то, что человек обязан делать».

    Crowdsourcing is a distributed problem-solving and production model. и т.д., [1]

    [1] http://en.wikipedia.org/wiki/Crowdsourcing

  10. Из этой статьи, на самом деле, тоже мало что понятно. Там ещё не к месту упоминается аутсорсинг. Это тот редкий случай, когда в русской Википедии статья лучше.
    Сейчас я понял, что такое краудсорсинг в случае IBM — есть проблема, и добровольцы и энтузиасты внутри компании её решают (похоже, бесплатно). Тем не менее, на мой взгляд «откорректированный краудсорсингом» — неправильно. Как неправильно, например, дерево распиленное пилением.

  11. rns123:

    > краудсорсинг в случае IBM
    > — есть проблема, и добровольцы и энтузиасты внутри
    > компании её решают (похоже, бесплатно).
    Отсюда рукой подать до общего определения краудсорсинга: удалите «в случае IBM» и «внутри компании», добавьте «или за деньги». Да, и еще: проблему, как правило, ставит заинтересованное лицо, он же обеспечивает технические средства для взаимодействия.

    > Тем не менее, на мой взгляд «откорректированный
    > краудсорсингом» — неправильно. Как неправильно,
    > например, дерево распиленное пилением.
    «распиленное пилением» — тавтология, у меня такого не было — не вполне удачный пример. «откорректированный краудсорсингом» — правильно. Как правильно, например, обработанный резанием, получаемый фрезерованием, загерметизированный давлением.

  12. Пример у меня неудачный, это точно. Впрочем «обработанные резанием» — тоже что-то странное.
    Мои претензии основаны, в общем-то, на личных ощущениях. «Методом краудсорсинга» для меня звучит неправильно. Но лучше, чем «откорректированный краудсорсингом» — тут вообще кажется, что краудсорсинг — какой-то аппарат для корректировки, либо такой особый способ корректирования (а краудсорсниг — это ведь больше, чем корректирование), либо программа для корректирования.

  13. rns123:

    Да, в данном случае краудсорсинг — это такой особый способ: есть проблема — не вполне адекватный машинный перевод — и добровольцы и энтузиасты её решают путем корректирования перевода.

  14. [...] IBM сделает самообучающийся переводчик, [...]

  15. [...] имевшие наработки в этой области, подсуетились, и выпускают разнообразные новинки. Европа тоже не дремлет и выделает щедрые гранты на [...]

  16. >Впрочем «обработанные резанием» — тоже что-то странное.

    Есть многое на свете, друг Денисио... :) Вполне нормальный руский технический язык. Почитайте, например, ГОСТы. Там найдёте упоминания деталей, поверхностей, элементов и т.п., «обработанных (или обрабатываемых) резанием», «обработанных шлифованием», «обработанных давлением» и т.д.

blog comments powered by Disqus