« Сентябрь 2022 »
Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

| 17 января 2018 | Информационные технологии

Искусственный интеллект превзошел человека в деле понимания прочитанной информации

Около 20 лет назад компьютер Deep Blue компании IBM победил Гарри Каспарова в игре в шахматы, и с того момента баталии между компьютерами и людьми продолжаются буквально каждый день. Искусственный интеллект DeepMind AlphaGo компании Google стал первым, которому удалось нанести поражение чемпиону мира по древней китайской игре Го, а сейчас эта программа продолжает учиться и обыгрывать человека в целом ряде других логических игр. А недавно две системы искусственного интеллекта, разработанные компаниями Alibaba и Microsoft, превзошли человека в деле понимания прочитанной информации, что проверяется при помощи специального теста, разработанного в Стэнфордском университете.

Нейронная сеть, снабженная алгоритмами глубинного машинного обучения и самообучения, созданная специалистами института Institute of Data Science of Technologies китайской компании Alibaba, прошла процедуру тестирования, дав ответы на 100 тысяч вопросов, касающихся информации, представленной в прочитанном тексте. По результатам теста китайский искусственный интеллект получил 82.44 балла, а на следующий день система компании Microsoft, пройдя этот же самый тест, набрала 82.65 балла. Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком, составляет 82.304 балла.

Отметим, что конечной целью исследователей компаний Microsoft и Alibaba является создание системы, способной эффективно обрабатывать большое количество данных, представленных в текстовом виде и, основываясь на усвоенной информации, давать более точные ответы на вопросы, задаваемые человеком.

"Такая технология может применяться в достаточно широком круге областей, включая системы обслуживания клиентов, обучающие программы, автоматические музейные гиды и системы, дающие консультации по медицинским вопросам" - рассказывает Луо Си (Luo Si), руководитель отдела научно-исследовательских работ компании Alibaba, - "Это, в свою очередь, позволит кардинально снизить нагрузку на некоторых людей и почти полностью убрать из процесса нестабильный человеческий фактор".

Добавить свое объявление
Загрузка...

Ключевые слова:
Искусственный, Интеллект, Текст, Чтение, Вопрос, Информация, Понимание, Тест, Человек, Microsoft, Alibaba

Первоисточник

Другие новости по теме:

Исследователи установили, что Google AlphaGo более "умна", чем Siri, Bing, Baidu и другие системы искусственного интеллекта

Программа AI AlphaGo Zero за несколько часов самообучения стала лучшей в игре в шахматы, Го и японские шахматы

Компания Microsoft устанавливает рекорд по точности работы системы распознавания естественной речи

Новая самообучаемая система компании Google учится создавать другие самообучаемые системы

Искусственный интеллект успешно справился со сдачей вступительных экзаменов в университет

| Комментарии: 15 |

17 января 2018 12:14

#1 Написал: svertino

Публикаций: 0
Комментариев: 55

Понимание чего либо должно измеряется какими-то единицами? Мне кажется кто-то путает алгоритм, пусть даже самый совершенный, с хаотичным и непредсказуемым сознанием. Ошибки уменьшают значимость программы зато увеличивают гибкость ума.
Не сомневаюсь, будут у машин чувства, основанные на математике. Вообще-то у людей всё наоборот - математика на чувствах. И никогда и никому не создать что-то похожее.

17 января 2018 14:12

#2 Написал: Rsa

Публикаций: 0
Комментариев: 0

"дав ответы на 100 тысяч вопросов, касающихся информации, представленной в прочитанном тексте"

"Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком, составляет 82.304 балла."

Покажите мне этого человека, ответившего на 100000 вопросов. Он вообще выжил после этого теста?:)
Ясно, что тут без какой-то подтасовки не обошлось и тесты для человека и машины определенно проводились по разным методикам. При таких объемах скорее память тестировалась, а не некое "понимание". Тут компьютер со своими терабайтами безошибочной памяти еще до старта у любого человека выиграл.

17 января 2018 18:26

#3 Написал: svertino

Публикаций: 0
Комментариев: 55

Вопросы примерно такие
"Что имелось ввиду под буквой "С" на 67 странице в 5 строке"
"Какой смысл был вложен в слово "Вот" на 124 странице в 26 строке"
Глубокий ступор, баллы в урну.

Машина привела Даля, процитировала Лермонтова и сочинила собственную поэму.

18 января 2018 04:43

#4 Написал: gen_sec

Публикаций: 0
Комментариев: 0

мдаа...100 к вопросов))))

19 января 2018 00:44

#5 Написал: Van

Публикаций: 0
Комментариев: 0

Rsa,
Братюнь, а где в тексте ты прочёл о человеке ответившем на 100к вопросов?

19 января 2018 01:15

#6 Написал: Philosoph

Публикаций: 0
Комментариев: 0

Van,

Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком, составляет 82.304 балла.

Наверное здесь об этом и написано или ты думал что этот тест был придуман для машин? Впредь читайте тексты более внимательно!
~~~~~~~~

Написали так словно есть результаты, отличные от нуля, пройденные не живым человеком...ну правда смешно же!

~~~~~~~~~
А вообще нужно уже смотреть и анализировать результаты прохождения теста Тьюринга, если кто-то вообще пытался это сделать. Мне кажется настало время для этого!
=====

Я вот только одного не понял почему все СМИ трубят об Alibaba (в заголовках именно он и фигурирует), а не про Microsoft, который на следующий же день утёр нёс китайскому брату?

19 января 2018 11:25

#7 Написал: Van

Публикаций: 0
Комментариев: 0

Philosoph,
"В этом тексте" не означает "ответил на сто тыщ вопросов"

Тест Тьюринга формально уже пошел робот у америкосов, но не все кто читал ответы с этим согласны правда они их читали уже зная результат что не правильно.

Я вот не помню кто вторым в космос полетел.

19 января 2018 19:18

#8 Написал: Rsa

Публикаций: 0
Комментариев: 0

Van, Там написано не "В этом тексте", а "В этом тесте". Если под "этим тестом" подразумевается какой-то иной тест, а не тот, в котором надо ответить на 100000 вопросов, то у автора явные проблемы с логическим мышлением.
Впрочем, конечно, наиболее вероятен вариант, что и тест этот самый, и на 100000 вопросов человек не ответил, а к примеру, умер от старости на 38654 вопросе, чем и заработал свои 82.304 балла wink

21 января 2018 09:47

#9 Написал: Van

Публикаций: 0
Комментариев: 0

Rsa,
Да я опечатался.
Этот текст оценивает уровень понимания в баллах а не абсолютных значениях.
Значит нет необходимости отвечать именно на сто тысяч вопросов, достаточно ответить на необходимый минимум, о котором не говорится потому что статья не о человеке.
ЗЫ. Вы бы, товарищи, за этот текст 82 бы точно не набрали)
Ззы. Прочитать 100 000 вопросов это примерно как прочитать 3 раза войну и мир, плюс ещё столько же на ответ.
Кроме того если два прочтения войны и мир вас займет до глубокой старости, то становится понятным по какой причине вы в тексте на понимание данной статьи не набрали бы 82. :)

Гребаннын т9. В тексте на понимание - следует читать как - в тесте на понимание

22 января 2018 00:11

#10 Написал: Rsa

Публикаций: 0
Комментариев: 0

Van, Уважаемый Van, не стану уподобляться вам, и выдвигать предположения о том, сколько бы баллов набрали лично вы, однако отвечу вот что:
Основой любой науки является повторяемый эксперимент, в котором условия всегда одинаковы для всех его участников. Если в одном случае задается 100000 вопросов, а в другом 100, а потом объявляют, что испытуемые прошли один и тот же тест, то грош цена таким сравнениям. Это уже не наука, а шарлатанство.

И еще, не знаю, что там за вопросы задавали, но среди них могут быть такие, перед ответом на которые нужно хорошенько подумать, вспомнить сюжет текста и контекст фразы, чтобы дать верный ответ. Именно такие и имеет смысл задавать, если исследователя интересуют вопросы понимания. И число 100000 однозначно говорит о том, что исходный текст весьма велик, наизусть его выучить вряд ли возможно, а значит большая часть времени будет потрачена не на произнесение ответа, как вы посчитали, в своих расчетах про "Войну и Мир", а на воспоминания обстоятельств текста по которым задан очередной вопрос. Причем, очевидно, что чем длиннее текст и чем больше вопросов, тем сложнее будет человеку. А вот машине до лампочки - она помнит текст всегда полностью. Более того, чем текст длиннее, тем проще алгоритму нащупать в нем какие-то связи и зависимости.
Надеюсь, я достаточно понятно объяснил, почему нельзя сравнивать тесты, если количество вопросов было разным?

p.s. Чтобы понять и запомнить все сюжетные линии, контексты и ассоциации "Войны и Мира", так чтобы суметь ответить на 100000 вопросов по ней, жизни и в самом деле может не хватить. Уж по крайней мере тем, кто не сделал это целью своей жизни.

22 января 2018 04:00

#11 Написал: Van

Публикаций: 0
Комментариев: 0

Rsa,
Для вас видимо будет сюрпризом, что сообщая о статистике типа "82% процента россиян смотрят телик" было опрошено дай бог пара тысяч.

Не зря там написано про лучший человеческий результат, некоторые и 20 небось не наберут)

22 января 2018 15:51

#12 Написал: Rsa

Публикаций: 0
Комментариев: 0

Van, Не путайте теплое с мягким. Этим паре тысячам опрошенных задавали одни и те же вопросы. Это 2000 одинаковых экспериментов, на основании которых набирается статистика. Если вдруг выяснится, что вопросы отличались, такая статистика сразу идет в помойку.

22 января 2018 16:37

#13 Написал: Van

Публикаций: 0
Комментариев: 0

Rsa,
Дык тут логика похожая.
Оценивается уровень понимания некоего текста, в процентах. Есть некое минимальное количество вопросов при котором результат будет считаться релевантным, и тогда не важно сколько именно было вопросов и о чем они.
Кроме того, если это тебе сложно, тогда раздели 100000 на 1000 и считай что программа выполнила работу 1000 человек ответив за каждого на 100 вопросов и выдав средний результат в восемьдесят с чем то баллов.

22 января 2018 17:49

#14 Написал: Rsa

Публикаций: 0
Комментариев: 0

Цитата: Van

Есть некое минимальное количество вопросов при котором результат будет считаться релевантным,

Это допустимо.

Цитата: Van

и тогда не важно сколько именно было вопросов и о чем они

А вот это совершенно недопустимо. Очевидно же, что разные вопросы дадут разные, логически не связанные друг с другом результаты. Они могут быть близки по конечным цифрам, но это будут разные эксперименты.

Цитата: Van

раздели 100000 на 1000 и считай что программа выполнила работу 1000 человек ответив за каждого на 100 вопросов и выдав средний результат

И получим "среднюю температуру по больнице". Ведь одни 100 вопросов могут оказаться существенно сложнее чем другой набор. И отвечали на них разные люди, с разным уровнем понимания. Статистику конечно можно набирать таким способом, однако утверждение из статьи:
"Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком" уже становиться логически неверным.
При такой методе, когда целиком весь тест ни один человек не проходил, можно оперировать только усредненными цифрами. Была бы фраза такой: "на этой группе тестов люди в среднем набирают лишь 81 балл", вопросов бы не было.

8 февраля 2018 11:00

#15 Написал: Van

Публикаций: 0
Комментариев: 0

Товарищ, вариантов тестов айкью даже в оригинале больше одного и тем не менее никто не говорит группа тестов. Все говорят тест айкью.
Выполнение нескольких одинаковых тестов но с разными текстом только увеличивает точность теста.

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Навигация

Мы в Сети

Календарь

Популярное

Облако тегов

Архивы

Счетчики

Искусственный интеллект превзошел человека в деле понимания прочитанной информации

Информация