plakhov: (Default)
[personal profile] plakhov
Пожалуйста, прочитайте название журнала перед тем, как просить совет насчет репертуара видеосалона. Я - не он. Спасибо.

Для тех, кто пришел по ссылке из списка ЖЖ-науки: и это тоже какая-то ошибка. Я не биолог и даже не ученый.
В палеонтологи меня записали, видимо, за пост про тиранозавров (хотя в нем ясно сказано обратное). Ну или, может быть, за один из этих:
http://plakhov.livejournal.com/104586.html
http://plakhov.livejournal.com/103042.html
http://plakhov.livejournal.com/100670.html
Может быть, какой-нибудь из них вам даже понравится.

Но вообще-то учился я на мехмате МГУ, кандидатскую защищал по 05.13.11, работаю в Яндексе, занимаюсь качеством поиска (чем-то средним между программированием, матстатистикой и лингвистикой). До этого несколько лет делал компьютерные игры (в Nival Interactive и в паре куда менее известных компаний), хорошие. Увлекаюсь чем попало всем сразу, читаю много умных книг (не настолько много, как некоторые), иногда пишу сюда что-нибудь научно-популярное.

На всякий случай: статью на "Мембране" про искусственный интеллект, собравшую 15 тысяч комментариев, писал я, но было это почти 10 лет назад, и сейчас она кажется мне наивной и неполной; не нужно по ней судить о чем бы то ни было.

Date: 2010-09-29 02:35 am (UTC)
From: [identity profile] senigami.livejournal.com
Вопрос из зала. Если вы немножко в теме машинного перевода, подскажите какие-нибудь ресурсы на эту тему.

Date: 2010-09-29 07:14 am (UTC)
From: [identity profile] plakhov.livejournal.com
Я немножко в теме, но вы уточните, что вам интересно. В смысле, вводные тексты типа http://googlesystem.blogspot.com/2010/08/how-google-translate-works.html, или профессиональные статьи, или форумы какие-нибудь?

Date: 2010-09-29 07:40 am (UTC)
From: [identity profile] senigami.livejournal.com
Спасибо за ответ. Мне интересны более профессиональные статьи. Если интересно я могу рассказать вам почему. Пол года назад я приехал работать в совершенно экзотическую страну - Южную Корею. На работе у меня почти все сносно говорят на английском. Но в личном общении с некоторыми корейцами мне нужно было использовать google.translator и я удивился насколько отвратительно он переводит даже самые простые фразы для пары английский - корейский и русский - корейский. Мне хочется узнать почему так.

Date: 2010-09-29 11:38 am (UTC)
From: [identity profile] plakhov.livejournal.com
Вот это попробуйте посмотреть:
http://www.mt-archive.info/MTS-2007-Koehn-3.pdf

Если честно, я не уверен, есть ли там ответ на ваш вопрос; но вкратце, дело в следующем. Качество статистического перевода зависит от двух факторов: от размер доступного корпуса параллельных текстов, и от близости самих языков. С первым фактором в случае пары "корейский - английский" думаю, проблем нет. А вот со вторым всё плохо: корейский - язык из совершенно другой семьи. В корейском другой порядок слов, каждое слово - это часто целая фраза в английском, одна и та же фраза может переводиться несколькими способами в зависимости от того, к кому человек обращается (типа русского ты/вы, только разнообразнее), и т.д. и т.п.

Ну и понятно, что в случае пары русский-корейский все еще хуже, проблемы и там, и там.

Date: 2010-09-29 11:51 am (UTC)
From: [identity profile] senigami.livejournal.com
Спасибо за статью. Я еще не достаточно изучил корейский, но мне кажется что русский все таки ближе к корейскому чем английский. Например, у нас есть почтительная форма обращения Вы и у корейцев есть. У нас окончание глагола меняется на -те когда мы обращаемся почтительно ("пойдемте", "посмотрите"), у корейцев тоже есть подобное окончание -йо. Чонохасейо - позвоните. И еще у них вопрос не как в английском выражается перестановкой слов, а как в русском - просто акцентом на конец предложения.

Date: 2010-10-01 07:15 am (UTC)
From: [identity profile] plakhov.livejournal.com
С русского на корейский они переводят через английский, т.к. не хватает величины корпуса параллельных текстов (что и логично, где их такие добудешь). А в процессе двойного перевода добавляется много новых ошибок.
Для иллюстрации, если переводить рус -> англ -> рус, получаем такое:

как дела? мои отлично, отдыхаю.
how are you? My fine, resting.
Как поживаете? Моя прекрасная, отдыхает.

Всё, и смысл, и интонация потерялись, а ведь фразы самые простые.

Date: 2010-10-04 04:56 am (UTC)
From: [identity profile] senigami.livejournal.com
Да. Если через английский то тогда понятно почему очень плохо получается. Так же теперь понятнее почему пара корейский -английский работает гораздо лучше пары корейский - русский. Статью начал уже читать и меня теперь интересовать стал другой вопрос. Существуют ли диалоговые системы перевода? То есть я имею в виду когда программа встречает неоднозначность она просто спрашивает у пользователя что он имел в виду. Понятно что перевод в таком виде не автоматический, но качество вполне можно ожидать гораздо лучше.
From: (Anonymous)
Андрей, привет, а почему ваш мэп не ищет такое "Угол Оптиков и Туристской, Санкт-Петербург" это же проще простого и вроде соответствует концепции.
From: [identity profile] fattomcat.livejournal.com
Статья на самом деле - супер. Наверное, Вы сами не совсем до конца поняли, ЧТО Вы на самом деле написали. Из-за нее захотел с Вами, Андрей, пообщаться (нашел Вас здесь, пришлось зарегиться в ЖЖ). Есть свежие идеи по ИИ, хотелось бы обсудить e-mailом. Пишите на savrasov_v@mail.ru
From: (Anonymous)
Наборы для игры в покер, в наличии как профессиональные фишки, так и фишки для домашней игры. Наборы для покера
как оптом, так и в розницу. Электронные сигареты оптом и в розницу! Самая низая цена!
Наборы для покера в кейсах (чемоданчиках) дешевле чем везде, например набор в боксе на 100 фишек-180 руб,
Электронные сигареты, не одноразовые, очень хорошего качества-355 руб за 1 пачку.
Более подробно на pokervam.ru

Предложение ограничено!!

Profile

plakhov: (Default)
plakhov

2017

S M T W T F S

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 25th, 2017 06:53 pm
Powered by Dreamwidth Studios