Искусственный интеллект превзошел человека в деле понимания прочитанной информации

Процесс чтения


Около 20 лет назад компьютер Deep Blue компании IBM победил Гарри Каспарова в игре в шахматы, и с того момента баталии между компьютерами и людьми продолжаются буквально каждый день. Искусственный интеллект DeepMind AlphaGo компании Google стал первым, которому удалось нанести поражение чемпиону мира по древней китайской игре Го, а сейчас эта программа продолжает учиться и обыгрывать человека в целом ряде других логических игр. А недавно две системы искусственного интеллекта, разработанные компаниями Alibaba и Microsoft, превзошли человека в деле понимания прочитанной информации, что проверяется при помощи специального теста, разработанного в Стэнфордском университете.

Нейронная сеть, снабженная алгоритмами глубинного машинного обучения и самообучения, созданная специалистами института Institute of Data Science of Technologies китайской компании Alibaba, прошла процедуру тестирования, дав ответы на 100 тысяч вопросов, касающихся информации, представленной в прочитанном тексте. По результатам теста китайский искусственный интеллект получил 82.44 балла, а на следующий день система компании Microsoft, пройдя этот же самый тест, набрала 82.65 балла. Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком, составляет 82.304 балла.

Отметим, что конечной целью исследователей компаний Microsoft и Alibaba является создание системы, способной эффективно обрабатывать большое количество данных, представленных в текстовом виде и, основываясь на усвоенной информации, давать более точные ответы на вопросы, задаваемые человеком.

"Такая технология может применяться в достаточно широком круге областей, включая системы обслуживания клиентов, обучающие программы, автоматические музейные гиды и системы, дающие консультации по медицинским вопросам" - рассказывает Луо Си (Luo Si), руководитель отдела научно-исследовательских работ компании Alibaba, - "Это, в свою очередь, позволит кардинально снизить нагрузку на некоторых людей и почти полностью убрать из процесса нестабильный человеческий фактор".



Ключевые слова:
Искусственный, Интеллект, Текст, Чтение, Вопрос, Информация, Понимание, Тест, Человек, Microsoft, Alibaba

Первоисточник

Другие новости по теме:
  • Исследователи установили, что Google AlphaGo более "умна", чем Siri, Bing, Baidu и другие системы искусственного интеллекта
  • Программа AI AlphaGo Zero за несколько часов самообучения стала лучшей в игре в шахматы, Го и японские шахматы
  • Компания Microsoft устанавливает рекорд по точности работы системы распознавания естественной речи
  • Новая самообучаемая система компании Google учится создавать другие самообучаемые системы
  • Искусственный интеллект успешно справился со сдачей вступительных экзаменов в университет




  • 17 января 2018 12:14
    #1 Написал: svertino

    Публикаций: 0
    Комментариев: 55
    Понимание чего либо должно измеряется какими-то единицами? Мне кажется кто-то путает алгоритм, пусть даже самый совершенный, с хаотичным и непредсказуемым сознанием. Ошибки уменьшают значимость программы зато увеличивают гибкость ума.
    Не сомневаюсь, будут у машин чувства, основанные на математике. Вообще-то у людей всё наоборот - математика на чувствах. И никогда и никому не создать что-то похожее.
        
    17 января 2018 14:12
    #2 Написал: Rsa

    Публикаций: 0
    Комментариев: 0
    "дав ответы на 100 тысяч вопросов, касающихся информации, представленной в прочитанном тексте"

    "Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком, составляет 82.304 балла."

    Покажите мне этого человека, ответившего на 100000 вопросов. Он вообще выжил после этого теста?:)
    Ясно, что тут без какой-то подтасовки не обошлось и тесты для человека и машины определенно проводились по разным методикам. При таких объемах скорее память тестировалась, а не некое "понимание". Тут компьютер со своими терабайтами безошибочной памяти еще до старта у любого человека выиграл.
        
    17 января 2018 18:26
    #3 Написал: svertino

    Публикаций: 0
    Комментариев: 55
    Вопросы примерно такие
    "Что имелось ввиду под буквой "С" на 67 странице в 5 строке"
    "Какой смысл был вложен в слово "Вот" на 124 странице в 26 строке"
    Глубокий ступор, баллы в урну.

    Машина привела Даля, процитировала Лермонтова и сочинила собственную поэму.
        
    18 января 2018 04:43
    #4 Написал: gen_sec

    Публикаций: 0
    Комментариев: 0
    мдаа...100 к вопросов))))
        
    19 января 2018 00:44
    #5 Написал: Van

    Публикаций: 0
    Комментариев: 0
    Rsa,
    Братюнь, а где в тексте ты прочёл о человеке ответившем на 100к вопросов?
        
    19 января 2018 01:15
    #6 Написал: Philosoph

    Публикаций: 0
    Комментариев: 0
    Van,
    Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком, составляет 82.304 балла.

    Наверное здесь об этом и написано или ты думал что этот тест был придуман для машин? Впредь читайте тексты более внимательно!
    ~~~~~~~~

    Написали так словно есть результаты, отличные от нуля, пройденные не живым человеком...ну правда смешно же!

    ~~~~~~~~~
    А вообще нужно уже смотреть и анализировать результаты прохождения теста Тьюринга, если кто-то вообще пытался это сделать. Мне кажется настало время для этого!
    =====

    Я вот только одного не понял почему все СМИ трубят об Alibaba (в заголовках именно он и фигурирует), а не про Microsoft, который на следующий же день утёр нёс китайскому брату?
        
    19 января 2018 11:25
    #7 Написал: Van

    Публикаций: 0
    Комментариев: 0
    Philosoph,
    "В этом тексте" не означает "ответил на сто тыщ вопросов"

    Тест Тьюринга формально уже пошел робот у америкосов, но не все кто читал ответы с этим согласны правда они их читали уже зная результат что не правильно.

    Я вот не помню кто вторым в космос полетел.
        
    19 января 2018 19:18
    #8 Написал: Rsa

    Публикаций: 0
    Комментариев: 0
    Van, Там написано не "В этом тексте", а "В этом тесте". Если под "этим тестом" подразумевается какой-то иной тест, а не тот, в котором надо ответить на 100000 вопросов, то у автора явные проблемы с логическим мышлением.
    Впрочем, конечно, наиболее вероятен вариант, что и тест этот самый, и на 100000 вопросов человек не ответил, а к примеру, умер от старости на 38654 вопросе, чем и заработал свои 82.304 балла wink
        
    21 января 2018 09:47
    #9 Написал: Van

    Публикаций: 0
    Комментариев: 0
    Rsa,
    Да я опечатался.
    Этот текст оценивает уровень понимания в баллах а не абсолютных значениях.
    Значит нет необходимости отвечать именно на сто тысяч вопросов, достаточно ответить на необходимый минимум, о котором не говорится потому что статья не о человеке.
    ЗЫ. Вы бы, товарищи, за этот текст 82 бы точно не набрали)
    Ззы. Прочитать 100 000 вопросов это примерно как прочитать 3 раза войну и мир, плюс ещё столько же на ответ.
    Кроме того если два прочтения войны и мир вас займет до глубокой старости, то становится понятным по какой причине вы в тексте на понимание данной статьи не набрали бы 82. :)

    Гребаннын т9. В тексте на понимание - следует читать как - в тесте на понимание
        
    22 января 2018 00:11
    #10 Написал: Rsa

    Публикаций: 0
    Комментариев: 0
    Van, Уважаемый Van, не стану уподобляться вам, и выдвигать предположения о том, сколько бы баллов набрали лично вы, однако отвечу вот что:
    Основой любой науки является повторяемый эксперимент, в котором условия всегда одинаковы для всех его участников. Если в одном случае задается 100000 вопросов, а в другом 100, а потом объявляют, что испытуемые прошли один и тот же тест, то грош цена таким сравнениям. Это уже не наука, а шарлатанство.

    И еще, не знаю, что там за вопросы задавали, но среди них могут быть такие, перед ответом на которые нужно хорошенько подумать, вспомнить сюжет текста и контекст фразы, чтобы дать верный ответ. Именно такие и имеет смысл задавать, если исследователя интересуют вопросы понимания. И число 100000 однозначно говорит о том, что исходный текст весьма велик, наизусть его выучить вряд ли возможно, а значит большая часть времени будет потрачена не на произнесение ответа, как вы посчитали, в своих расчетах про "Войну и Мир", а на воспоминания обстоятельств текста по которым задан очередной вопрос. Причем, очевидно, что чем длиннее текст и чем больше вопросов, тем сложнее будет человеку. А вот машине до лампочки - она помнит текст всегда полностью. Более того, чем текст длиннее, тем проще алгоритму нащупать в нем какие-то связи и зависимости.
    Надеюсь, я достаточно понятно объяснил, почему нельзя сравнивать тесты, если количество вопросов было разным?

    p.s. Чтобы понять и запомнить все сюжетные линии, контексты и ассоциации "Войны и Мира", так чтобы суметь ответить на 100000 вопросов по ней, жизни и в самом деле может не хватить. Уж по крайней мере тем, кто не сделал это целью своей жизни.
        
    22 января 2018 04:00
    #11 Написал: Van

    Публикаций: 0
    Комментариев: 0
    Rsa,
    Для вас видимо будет сюрпризом, что сообщая о статистике типа "82% процента россиян смотрят телик" было опрошено дай бог пара тысяч.

    Не зря там написано про лучший человеческий результат, некоторые и 20 небось не наберут)
        
    22 января 2018 15:51
    #12 Написал: Rsa

    Публикаций: 0
    Комментариев: 0
    Van, Не путайте теплое с мягким. Этим паре тысячам опрошенных задавали одни и те же вопросы. Это 2000 одинаковых экспериментов, на основании которых набирается статистика. Если вдруг выяснится, что вопросы отличались, такая статистика сразу идет в помойку.
        
    22 января 2018 16:37
    #13 Написал: Van

    Публикаций: 0
    Комментариев: 0
    Rsa,
    Дык тут логика похожая.
    Оценивается уровень понимания некоего текста, в процентах. Есть некое минимальное количество вопросов при котором результат будет считаться релевантным, и тогда не важно сколько именно было вопросов и о чем они.
    Кроме того, если это тебе сложно, тогда раздели 100000 на 1000 и считай что программа выполнила работу 1000 человек ответив за каждого на 100 вопросов и выдав средний результат в восемьдесят с чем то баллов.
        
    22 января 2018 17:49
    #14 Написал: Rsa

    Публикаций: 0
    Комментариев: 0
    Цитата: Van
    Есть некое минимальное количество вопросов при котором результат будет считаться релевантным,
    Это допустимо.

    Цитата: Van
    и тогда не важно сколько именно было вопросов и о чем они
    А вот это совершенно недопустимо. Очевидно же, что разные вопросы дадут разные, логически не связанные друг с другом результаты. Они могут быть близки по конечным цифрам, но это будут разные эксперименты.

    Цитата: Van
    раздели 100000 на 1000 и считай что программа выполнила работу 1000 человек ответив за каждого на 100 вопросов и выдав средний результат

    И получим "среднюю температуру по больнице". Ведь одни 100 вопросов могут оказаться существенно сложнее чем другой набор. И отвечали на них разные люди, с разным уровнем понимания. Статистику конечно можно набирать таким способом, однако утверждение из статьи:
    "Для сравнения, самый высокий результат в этом тесте, продемонстрированный живым человеком" уже становиться логически неверным.
    При такой методе, когда целиком весь тест ни один человек не проходил, можно оперировать только усредненными цифрами. Была бы фраза такой: "на этой группе тестов люди в среднем набирают лишь 81 балл", вопросов бы не было.
        
    8 февраля 2018 11:00
    #15 Написал: Van

    Публикаций: 0
    Комментариев: 0
    Товарищ, вариантов тестов айкью даже в оригинале больше одного и тем не менее никто не говорит группа тестов. Все говорят тест айкью.
    Выполнение нескольких одинаковых тестов но с разными текстом только увеличивает точность теста.
        

    Информация

    Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.