16 января 2013 в 17:59

Начато восстановление удалённых из Википедии статей

В сентябре прошлого года я сообщал о намерении сотрудников открытого вики-проекта «Циклопедия» начать восстановление данных, удалённых в русской Википедии. До того момента было произведено скачивание удалённых статей, картинок, шаблонов и некоторых представляющих интерес страниц на независимые хранилища.

Поскольку Циклопедия — энциклопедический проект, администраторы сохраняют там не всякий спам или самопиар пользователей контакта, но статьи о реальных людях, событиях, компаниях. Для начала выборка статей была произведена по определённому алгоритму, отсеивающему явный вандализм.

Например, восстановлены многие статьи о вымышленной вселенной «Вавилон-5». Список всех залитых статей можете прочитать на специальной странице.

По пояснениям программистов бота, алгоритм был следующим.
* Статьи с таким названием сейчас нет в Википедии (т.е. она не была воссоздана в виде отдельной статьи — только как перенаправление);
* В комментарии к удалению страниц нет одного из ключевых слов наподобие «вандализм» или «нарушение авторских прав», которые показывают, что страница вероятнее всего не представляет никакой ценности.

Бот отработал прошлой осенью, отобрав список из примерно 100 тысяч удовлетворяющих этим условиям статей.

В начале этого года был наконец запущен бот заливки. Он вздолбнул Циклопедию статьями — в неё поступило более 2 тысяч удалённых статей из русской Википедии. На подходе ещё как минимум несколько тысяч небезынтересных статей. Их полный список вы можете прочитать по ссылке выше. При этом данными статьями не исчерпывается уникальный контент Циклопедии: есть множество статей о фразах, песнях и, например, знаковых кинофильмах.

В статьях есть шаблоны, категории и картинки.
+21
15806
27

комментарии (70)

+22
Suncheez, #
«взрыл и вздолбнул» — тут у меня извилины скондылябились.

А за «Вавилон 5» — спасибо вот-такенное.
0
Serebr, #
На правах организатора Циклопедии хочу добавить, что для хабровчан особенно интересной может быть возможность восстановления удаленных в Википедии статей о программном обеспечении, а также возможность написания новых статей по теме программирования без оглядки на критерии значимости, принятые в Википедии.
+1
stboris, #
А чем им Вавилон-5 не угодил-то?
+2
Aingis, #
Подозреваю, излишней детализацией при нехватки авторитетных источников. Про В-5 вообще на лурке неплохая статья. А вообще такое обычно на викиах описывают.
+5
Serebr, #
Удалисты, сэр.
+3
Alexeyco, #
Все-таки, не понимаю. «Энциклопедия» — с греческого грубо означает «круг знаний», или, если менее грубо — «знания в круге» (ну или «обучение в круге» — кому как нравится). То есть, некий массив данных с перекрестными ссылками. Согласно той же Википедии, универсальная энциклопедия — это энциклопедия, охватывающая весь круг знаний о мире и человеке.

Я так и не понял, почему, скажем, статьи о «Вавилоне 5» не относятся к кругу знаний о мире и человеке.
+2
Serebr, #
Относятся. Но в Википедии есть куча разнообразных правил, особенно бьющих по «вымышленным мирам». В частности, при написании статей рекомендуется пользоваться вторичными источниками (то есть всякими рецензиями на то или иное художественное произведение, а не самим этим произведением). В Циклопедии этого ограничения нет, поэтому добро пожаловать в Циклопедию!
0
nanotime, #
Может у них там начальство поменялось? Раньше шапку носили так, а теперь — по-другому.
+2
vbif, #
Даёшь полторы тысячи одинаковых статей об общеобразовательных школах Москвы!
0
Serebr, #
А почему сразу одинаковых? Школы — интересная тема, сначала в русской Википедии все школы считались имманентно значимыми, но потом ситуация поменялась в пользу удализма.
0
vbif, #
От имманентной значимости школ отказались скорее всего потому, что статьи о них никому не были нужны, кроме тех, кто их писал.
+1
lfway, #
Что на счёт статьи про дефарминг?
0
cryptocoryne, #
Как она называлась? Удалённой статьи «дефарминг» в Википедии нет.
+1
lfway, #
Так и называлась. «Defarming» в английской вики, «дефарминг» — в нашей. Про миллионые жертвы от голода и репрессий в США в начале 20го века. Кстати, на хабре писали об этом, но сейчас ту заметку найти не получилось.
0
Serebr, #
Про дефарминг или «американский голодомор» можно написать (с учетом критики этой теории естественно), попробуем.
НЛО прилетело и опубликовало эту надпись здесь
0
Serebr, #
Видимо так и надо описать что «современная теория некоторых русскоязычных авторов.»
НЛО прилетело и опубликовало эту надпись здесь
+1
Serebr, #
Википедисты уже заранее негодуют на своем форуме )
НЛО прилетело и опубликовало эту надпись здесь
0
Serebr, #
Оригинальное исследование ("Орисс" на жаргоне википедистов) в Циклопедии допустим в довольно ограниченных масштабах, можно делать только более-менее очевидные консенсусные выводы.

Самостоятельное исследование на подобную тему можно опубликовать, например, в Традиции или Руксперте.
+5
amdf, #
Статью Дыхательные процессы (Звёздные Войны) будут восстанавливать?
+4
Zlobober, #
А ещё Вдох Вейдера, Выдох Вейдера, Хохломасон и Хомячки-убийцы.

(кто не знает первоисточник — баш 396451)
+1
Serebr, #
Вряд ли )))
0
vsespb, #
Кстати, тут какие-то дампы википедии лежат, не уверен то что нужно, но может где-то можно обойтись без бота…
dumps.wikimedia.org/backup-index.html
aws.amazon.com/datasets/2506
aws.amazon.com/search?searchQuery=wiki&searchPath=datasets&x=0&y=0
+1
lifestar, #
А кто вообще решает удалять статью или нет? А то я пожертвовал 10$ в прошлом году и недоволен теперь этим удалением
+1
Serebr, #
Решают администраторы Википедии, удаляют часто по совершенно надуманным причинам. В принципе иногда удается восстановить статью через обсуждение, потом по новой ее могут удалить и т.д.
+4
StrangeAttractor, #
Поддерживаю. Лично я глубоко возмущён удалением (и не только в русской части) как целых отличных статей так и отдельных параграфов под предлогом несущественности. В связи с этим я решил больше ничего туда не писать. Тем не менее десять баксов пожертвовать можно — всё же от Википедии и без удалённого не мало пользы.
0
amarao, #
Другими словами, к вам попадает всякая ахинея, которая удаляется по основанию «недостоверность». Подождём чуток, когда соберёте всё…

В самом начале проекта (в русском разделе Википедии тогда было меньше 10к статей) я из-под виртуала написал три совершенно ахинистические статьи очень правдоподобного содержания. Мне было интересно, сколько они проживут. Надо сказать, прожили они довольно долго, но в итоге все три были удалены из-за сомнений в достоверности и отсутствии источников. Сами статьи неподготовленный читатель никаким образом от нормальных статей не отличит.

И вы планируете их восстановить и тщательно беречь?
+1
Serebr, #
С одной стороны в Википедии удалена масса приличных статей, с другой стороны в Википедии и сейчас немало мистификаций. Удалим постепенно, если таковые попадутся при переносе.
0
amarao, #
А как вы будете отличать митификацию от правды? Например, в статье нет источников. В Википедии отсутствие источников (а так же тех, кто за время обсуждения удаления может напрячься и найти оные) является вполне себе основанием удаления.

Для усиления драмы подкину ещё один вопрос: а если я сделаю сайт на народе, который будет приведён в статье как источник, вас он устроит?

(Я думаю, вы вполне понимаете, к чему я клоню — либо вы скажете, что «ваш мудрый административный произвол мудрее википедии», либо вы будете вынуждены прийти к понятию авторитетных источников).

А потом я задам вам вопрос про АА-конфликт и мы плавно перейдём к обсуждению НТЗ…
+4
Serebr, #
Это все самоуспокаивающие мантры, в Википедии масса статей без источников, и даже полное несоответствие источникам утверждений в статье «Калан» не мешало ей считаться «избранной», так как ее писал «уважаемый участник».

Здравый смысл и гугл нам в помощь.

Сайт на народе смотря какой. Вообще говоря надо смотреть на цитируемость сайта, и сайт на народе скорее не нужен как источник.
+1
amarao, #
погодите. Я никого не пытаюсь никого успокоить. Я хочу у вас узнать, как вы будете определять, какая статья правда, а какая — мистификация.

… Кстати, посмотрите, вы уже сами говорите, что не всякий источник подойдёт, а следует оценить является ли он достаточно цитируемым (ага, авторитетным) для того, чтобы на него ссылаться.

Предложение использовать «здравый смысл» несколько лет назад вы называли административным произволом, нет? Или что-то поменялось?
+1
KarasikovSergey, #
А мне вот всегда было интересно — как википедия оценивает релевантность источников? Вот на одно масштабное событие или личность может быть огромное количество аналитического материала. Статья в википедии может содержать оценочные суждения, быть однобокой и иметь следы определенной пропагандистской деятельности, а в качестве источников — приводить удобные труды людей, согласующиеся точкой зрения автора статьи.
Получается, что с одной стороны все условия выполнены, а с другой — может ли такая статья считаться энциклопедичной?
НЛО прилетело и опубликовало эту надпись здесь
0
KarasikovSergey, #
И как, успешно? Откройте статью по арабо-израильским конфликтам. Образец нейтральности и разнообразия источников с разных сторон.
НЛО прилетело и опубликовало эту надпись здесь
–1
KarasikovSergey, #
Вопрос не в этом, а в предоставлении читателю возможности делать свои выводы на основе максимального разнообразия оценок и мнений. Пусть каждый сам решает — где правда, а где вымысел, но энциклопедия должна предоставлять материал для ознакомления со всех сторон.
НЛО прилетело и опубликовало эту надпись здесь
+1
KarasikovSergey, #
Это не только проблема интернета, бумага тоже все стерпит, более того, при грамотной подаче можно любое количество людей убедить в любом дебилизме. Вроде как Разрушителей Мифоф некоторые люди считают передачей про науку и на полном серьезе в качестве аргумента приводят их «доказательства». Википедия из той же обоймы — создает иллюзию энциклопедии, на которую клюют люди и распространяют чьи то точки зрения как истину.
НЛО прилетело и опубликовало эту надпись здесь
–1
KarasikovSergey, #
С другой стороны мистика.ру настолько очевидна, что не способна повлиять на мнение человека о тех или иных реальных событиях или явлениях, а википедия именно этим и занимается, выступая под личиной энциклопедии.
НЛО прилетело и опубликовало эту надпись здесь
0
KarasikovSergey, #
Ничем, кроме того, что источник — это конкретный автор, отвечающий за свои слова репутацией, а статья в вики — это безымянный текст, подкрепленный источниками на выбор анонима. Если вы кидаете какой-то источник — его могут взять на смех, как несостоятельный. Статью же в вики большинство принимает за истину зачастую даже не анализируя источники.
НЛО прилетело и опубликовало эту надпись здесь
–1
KarasikovSergey, #
То есть вы слепо доверяете некоему «сообществу» в выборе «фактов», которые будут влиять на ваше мировоззрение?
0
amarao, #
А почему то же самое нельзя сделать со статьёй в Википедии? Я, например, довольно часто отвечаю, что мол, написано-то написано, источник не указан.

А в сложных случаях иду и проверяю по источнику (когда меня этот вопрос касается больше и практичнее, чем вопрос кто кого больше убивал, арабы или евреи).

Кроме того, статьи в Википедии большей частью написаны не анонимами.
0
KarasikovSergey, #
Веселье в том, что все источники указаны, но кто за эти источники поручится? Вот например статьи о репрессиях написаны под впечатлением от строго определенной точки зрения определенных источников. Которые с одной стороны в мире любимы и цитируемы, а с другой — писали художественные произведения, пусть даже и на основе своего видения реалий времени. Тот же Солженицын никогда в жизни не имел доступа ни к каким архивным цифрам, но не стеснялся ими жонглировать в полный рост.
В итоге — статья есть, мнение «мирового сообщества» отражает, альтернативных точек зрения на вопрос не допускает, источники — как на подбор в первой десятке цитируемых сторонниками именно такого толкования, как в статье.
НЛО прилетело и опубликовало эту надпись здесь
–1
KarasikovSergey, #
Я предлагаю не воспринимать википедию всерьез и использовать ее только в качестве отправной точки по нахождению интересующей информации.
НЛО прилетело и опубликовало эту надпись здесь
+1
TerrorDroid, #
Более того, когда по какой-то причине у них случается лажа и зрители доносят свою точку зрения по поводу того, что и где было сделано неправильно, то они вполне себе повторяют эксперименты с корректировками — более чем разумный и ответственный подход, особенно для развлекательного шоу.
+1
amarao, #
Вы знаете, мифбастерсы имеют к науке отношение куда большее, чем большинство научных программ в стиле «а вот умные учёные придумали, мы не знаем почему это так, но учёные умные, им видней».

Самой блистательной серией их я считаю серию про опроверждение утверждения, что нелья заставить плыть лодку, если дуть в парус вентилятором, установленным на той же лодке.
–2
KarasikovSergey, #
А для меня показательно их «исследование» о невозможности убиться током, помочившись на высоковольтный кабель. В противовес их словам о невозможности подобного выступает огромное количество документально подтвержденных случаев именно такой нелепой смерти.
НЛО прилетело и опубликовало эту надпись здесь
–2
KarasikovSergey, #
Это не формат хабра, но можете потратить 5 минут времени, чтобы убедиться, что эти теоретические выкладки в реальной жизни не работают.
НЛО прилетело и опубликовало эту надпись здесь
+1
TerrorDroid, #
их «исследование» о невозможности убиться током, помочившись на высоковольтный кабель

Если мне не изменяет память, то указанный эксперимент они как раз таки повторили позже, после чего у них было два вывода:

1) сам проход напряжения через струю мочи в принципе возможен, но только если источник напряжения находиться достаточно близко к человеку, дабы расстояние было таковым, на котором струя не успевает разбиваться на капли — они смогли получить положительный результат (с соответствующим Plausible вердиктом) в случае если мочиться на забор, к которому подведено электричество;

2) убиться помочившись на «третий рельс» (ни о каком кабели речи не шло) нельзя как раз таки из-за чрезмерного расстояния, на котором струя успевает разбиваться на капли;

выступает огромное количество документально подтвержденных случаев

При всем уважении, но порой «документально подтвержденой» может быть самая разная ахинея.
НЛО прилетело и опубликовало эту надпись здесь
0
Serebr, #
Проще всего присоединиться к Циклопедии и начать писать в ней. Если есть конкретные идеи и предложения, можно писать мне в личку.
НЛО прилетело и опубликовало эту надпись здесь
0
amarao, #
Есть некий формальный набор критериев к источникам. В большинстве случаев он работает, но в ряде запущенных случаев (тот же АА конфликт) приходится идти на дополнительные ужесточения требований к источникам.

Вопрос нейтральной точки зрения очень сложен. В общем случае — в статье должна излагаться не некая согласованная позиция, а пересказ мнений источников, с указанием чьё это мнение и отношение к этому мнению оппонентов. Собственно, относительный успех Википедии в АА-конфликте (оцените нейтральность статьи ru.wikipedia.org/wiki/НКР), хоть он и дался огромными усилиями, я считаю жизнеспособностью модели.

Но это вовсе не означает, что статьи в Википедии на конфликтные темы всегда нейтральны. Нужно достаточно обширное представительство сторонников той или иной точки зрения, а также желание сообщества оных сторонников разводить по конструктивному пути.
+1
KarasikovSergey, #
Это все звучит просто замечательно, но в итоге мы имеем непрекращающуюся войну правок, в которой побеждает не взвешенный нейтральный подход, а тупо масса сочувствующих той или иной теории. Следующая сложность — определить эмоциональный окрас источников. Не всегда можно сразу понять — предвзята ли точка зрения автора или же он и правда ради науки старается. Это вам не современная российская политота, когда открываешь журнал «дилетант» и на третьем предложении любой статьи в нос ударяет «Эхо Москвы» или открываешь Вассермана — а там сходу аве Путин играет в каждой второй новости.
В википедии куда более тонкие технологи орудуют.
+1
vilky, #
Я когда-то мечтала о вики-энциклопедии недостоверщины, ну как если бы её писали тётушки, уверенные, что с другой стороны Земли живут люди с псиными головами (но со всеми современными фрикомифами). Потом появилась Абсурдопедия, но оказалась не совсем тем, потом Луркмор — тоже не то.
Может, из Циклопедии, если в ней пойдёт отрицательный отбор по достоверности, выйдет…
0
cryptocoryne, #
А что не так в Абсурдопедии? В absurdopedia.net вполне годные статьи пишут.
0
Serebr, #
Все современные опубликованные фрикомифы можно описать в Циклопедии.

Они часть современной культуры или мифологии, кому как удобнее считать, и их следует описывать в идеальной всеобъемлющей эницклопедии, от которой Википедия, увы ушла.

Отрицательного отбора по достоверности нет.
–3
Serebr, #
Реакция некоторых википедистов

Порадовал Scorpion-811:

При упоминании данного ресурса будет нелишним напомнить участникам, что его владельцы собирают и анализируют персональные данные (такие как IP, user-agent, ОС), причём протоколируются не только правки (как в Википедии) — но и простые посещения (в частности, отслеживается интерес отдельных посетителей к конкретным страницам).
0
vilky, #
По названию и
«концепции»
(извините за кавычки, но если вы когда-то активно писали в Википедию и сталкивались с персонажем, выступающим здесь под именем Serebr, читать про «здравый смысл», который у него придёт на смену википедийным формализованным критериям значимости и достоверности, вам будет очень смешно; тем не менее, согласна, что какая-то часть статей, не подошедших Википедии, не должна пропадать)
представила, что логотипом у проекта будет всем знакомый треугольник из стрелочек, символ вторичной переработки. Эх!
+2
Serebr, #
Критерии значимости в Циклопедии вполне формализованные, просто более мягкие (должны быть упоминания в надежных печатных источниках или СМИ), опубликованные произведения — источники для статей о них самих.

Википедийные правила НТЗ (нейтральность) и ВЕС (взвешенность) фактически действуют и зашиты в правило о формате статей.

Приятно узнавать о себе новое.
+1
spmbt, #

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.