Исследователи из университета Карнеги-Меллон (Carnegie Mellon University, CMU) создали программное обеспечение, которое позволяет компьютеру считывать информацию и учиться. Компьютер Nell, Never Ending Language Learner, самообучается, обнаруживая информацию на просторах Интернета, сравнивает одну и ту же информацию, полученную из разных источников, и классифицирует полученную информацию как факты или предположения. Этот процесс самообучения подобен процессу самообучения у людей.
В настоящий момент, по информации, полученной от исследователей CMU, компьютер NELL самостоятельно изучил порядка 440 тысяч различных понятий, его вероятность отделения фактов от предположений составляет около 74%, что, согласитесь, совсем неплохо для компьютера. Как же NELL отделяет зерна от плевел? Если какая-либо информация упоминается всего на одном, но достаточно авторитетном, источнике, то она принимается как факт. Фактом так же становится информация, которая упоминается на множестве менее авторитетных источников. В других случаях собранная информация классифицируется как предположение.
Несмотря на столь рациональный подход к классификации информации, у компьютера NELL существует несколько проблем с самообучением. Первой, и основной, проблемой является то, что пока компьютер не может выполнить повторную классификацию полученной ранее информации. К примеру, если в результате начального обучения компьютер выяснил, что Земля является плоской, то, даже в случае обнаружения им новых научных данных, утверждающих, что Земля круглая, он не может сделать обновление сделанных им выводов. Второй проблемой, с которой пришлось столкнуться компьютеру NELL в самообучении, является наличие в информации большого количества идиом, жаргона и специфических выражений, которые попросту путают выводы компьютера и искажают результаты его обучения.