Люди, которые интенсивно пользуются интернет-энциклопедией Wikipedia, наверняка стали замечать, что в ней стало появляться все больше и больше материала, наполненного цифрами и фактами, и написанного "сухим", иногда даже кажущимся неестественным языком. Это является прямым следствием того, что подавляющее большинство новых материалов для Википедии уже создается не людьми-энтузиастами, авторами этого материала являются специализированные программы-боты, которые в автоматическом режиме собирают данные из множества достоверных источников, обрабатывают эти "сырые" данные и производят удобочитаемый текст статьи на основе одного из стандартизованных шаблонов.
Согласно информации, опубликованной недавно издательством Wall Street Journal, самой продуктивной программой-ботом является программа Lsjbot, которая добавляет в Википедию около 10 тысяч статей в день, а всего ее "перу" принадлежит около 2.7 миллиона уже размещенных статей, что составляет 8.5 процентов от общего количества. Программа Lsjbot является детищем Сверкера Йоханссона (Sverker Johansson), сотрудника Шведского университета, которые имеет ученые степени в области лингвистики, гражданского строительства, экономики и физики элементарных частиц.
Большинство статей, генерируемых программой Lsjbot, касается видов животных и описаний небольших городов на Филлипинах. Две трети статей написаны на языке филлипино и одна треть - на шведском языке. Как только программе указывают объекты для написания статей, к сожалению, она пока не может искать их самостоятельно, программа собирает из разных уголков Интернета всю доступную информацию, пишет статью и отправляет ее на Википедию.
Википедия принимает статьи от нескольких видов программ-ботов, к примеру от программы rambot, которая используется для сбора данных и написания статей об американских городах, округах и штатах. Но создание Сверкера Йоханссона является безусловным лидером, как по качеству, так и по количеству посылаемого в Википедию материала.
У практики использования автоматизированных программ-ботов для наполнения Википедии имеется масса противников. Но Йоханссон яро защищает такой подход, аргументируя это тем, что достаточно большое количество материала в Википедии написано "малолетними кретинами". В качестве примера он приводит, что в шведском сегменте Википедии присутствует 150 статей, касающихся темы "Властелина колец", а тематике войны во Вьетнаме посвящено всего 10 статей, да и те не блещут информативностью. В статьях же, сформированных программой Lsjbot, предоставлена только достоверная информация, взятая из надежных источников, эти статьи точны, за крайне редкими исключениями, и с помощью программ-ботов можно осветить в Википедии те темы, до которых у живых людей никогда не дошли бы руки.
Ключевые слова:
Lsjbot,
Программа,
Бот,
Статьи,
Материал,
Википедия,
Wikipedia
Первоисточник
Другие новости по теме:
Корейский робот-журналист освещает спортивные события спустя две секунды после завершения матчейСуперкомпьютер Watson компании IBM пробует себя в роли участника дебатовНовые алгоритмы помогают оценить и упорядочить научную литературу в автоматическом режимеВедется создание онлайн-энциклопедии, которая будет писать сама себя.Суперкомпьютер, анализируя мировые новости, сможет предсказывать будущие события.