Lsjbot - программа-бот, "перу" которой принадлежит 2.7 миллиона статей Википедии

Бот


Люди, которые интенсивно пользуются интернет-энциклопедией Wikipedia, наверняка стали замечать, что в ней стало появляться все больше и больше материала, наполненного цифрами и фактами, и написанного "сухим", иногда даже кажущимся неестественным языком. Это является прямым следствием того, что подавляющее большинство новых материалов для Википедии уже создается не людьми-энтузиастами, авторами этого материала являются специализированные программы-боты, которые в автоматическом режиме собирают данные из множества достоверных источников, обрабатывают эти "сырые" данные и производят удобочитаемый текст статьи на основе одного из стандартизованных шаблонов.

Согласно информации, опубликованной недавно издательством Wall Street Journal, самой продуктивной программой-ботом является программа Lsjbot, которая добавляет в Википедию около 10 тысяч статей в день, а всего ее "перу" принадлежит около 2.7 миллиона уже размещенных статей, что составляет 8.5 процентов от общего количества. Программа Lsjbot является детищем Сверкера Йоханссона (Sverker Johansson), сотрудника Шведского университета, которые имеет ученые степени в области лингвистики, гражданского строительства, экономики и физики элементарных частиц.

Большинство статей, генерируемых программой Lsjbot, касается видов животных и описаний небольших городов на Филлипинах. Две трети статей написаны на языке филлипино и одна треть - на шведском языке. Как только программе указывают объекты для написания статей, к сожалению, она пока не может искать их самостоятельно, программа собирает из разных уголков Интернета всю доступную информацию, пишет статью и отправляет ее на Википедию.

Википедия принимает статьи от нескольких видов программ-ботов, к примеру от программы rambot, которая используется для сбора данных и написания статей об американских городах, округах и штатах. Но создание Сверкера Йоханссона является безусловным лидером, как по качеству, так и по количеству посылаемого в Википедию материала.

У практики использования автоматизированных программ-ботов для наполнения Википедии имеется масса противников. Но Йоханссон яро защищает такой подход, аргументируя это тем, что достаточно большое количество материала в Википедии написано "малолетними кретинами". В качестве примера он приводит, что в шведском сегменте Википедии присутствует 150 статей, касающихся темы "Властелина колец", а тематике войны во Вьетнаме посвящено всего 10 статей, да и те не блещут информативностью. В статьях же, сформированных программой Lsjbot, предоставлена только достоверная информация, взятая из надежных источников, эти статьи точны, за крайне редкими исключениями, и с помощью программ-ботов можно осветить в Википедии те темы, до которых у живых людей никогда не дошли бы руки.



Ключевые слова:
Lsjbot, Программа, Бот, Статьи, Материал, Википедия, Wikipedia

Первоисточник

Другие новости по теме:
  • Корейский робот-журналист освещает спортивные события спустя две секунды после завершения матчей
  • Суперкомпьютер Watson компании IBM пробует себя в роли участника дебатов
  • Новые алгоритмы помогают оценить и упорядочить научную литературу в автоматическом режиме
  • Ведется создание онлайн-энциклопедии, которая будет писать сама себя.
  • Суперкомпьютер, анализируя мировые новости, сможет предсказывать будущие события.




  • 19 июля 2014 03:06
    #1 Написал: Rsa

    Публикаций: 0
    Комментариев: 0
    Вот эти 2 абзаца никак не стыкуются и в сумме противоречат здравому смыслу:

    программа Lsjbot, которая добавляет в Википедию около 10 тысяч статей в день, а всего ее "перу" принадлежит около 2.7 миллиона уже размещенных статей, что составляет 8.5 процентов от общего количества.

    Большинство статей, генерируемых программой Lsjbot, касается видов животных и описаний небольших городов на Филлипинах. Две трети статей написаны на языке филлипино и одна треть - на шведском языке. Как только программе указывают объекты для написания статей, к сожалению, она пока не может искать их самостоятельно, программа собирает...

    2.7 миллиона статей на филлипинском и шведском языке про местные городки и животных (откуда столько?) составляют 8.5% всех статей в Википедии? Ни одна из цифр не похожа на правду. Более того, если программа не может самостоятельно находить объекты для новых статей, кто ей поставляет их по 10000 штук в день, да еще и на столь узкие и малозначительные темы? Все приведенные цифры, если оценить их совокупный смысл, выглядят как полный бред.
        

    Информация

    Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.