Многие из нас хотя бы раз при поиске чего-нибудь в Google (например, поиск фильма по названию) сталкивались с сообщением, что материал был удален по требованию правообладателей (честно говоря, точную формулировку уже не помню). Понятно, что корпорации приходится удалять многие тысячи таких ссылок — ведь правообладатели не шутят, могут и засудить за невыполнение законных требований. Оказывается, что работникам компании приходится удалять многие сотни тысяч таких ссылок.
Впервые в истории России интернет-портал обогнал самый популярный телеканал.
В апреле 2012 года
«Первый» смотрело
18,2 млн человек в день, а посетителями
«Яндекса» стали
19,1 млн человек в день,
сообщают «Ведомости» со ссылкой на TNS.
Практически догнав телеканал по недельной аудитории, поисковая система всё ещё отстаёт от него по длительности посещения. Тот же «Первый» зрители смотрят больше часа в день, а на «Яндекс» заходят на 10 минут.
При этом, стремительно сокращается разница между аудиторией телевидения и рунета. Так в апреле ежедневно интернетом пользовались всего на миллион меньше людей, чем смотрели ТВ.
Несмотря на предрассудки многих рекламодателей, предпочитающих телевидение, вероятно, уже в этом году «Яндекс» заработает больше, чем «НТВ», а в следующем, обгонит по выручке и «Первый».
Поисковая система «Яндекс» уже давно показывает пользователям подсказки. Это достаточно полезная функция, которую внедряют практически все поисковые сервисы. Порой очень удобно ввести только часть запроса, и получить весь запрос. Разработчики из «Яндекса» решили сделать поисковые подсказки еще более полезными, и теперь в поисковых подсказках можно видеть нужные пользователю цифры и факты. Другими словами, ответ на некоторые вопросы можно получить еще в поисковой строке.

На сайте
sortbenchmark.org ежегодно проводятся конкурсы по сортировке больших наборов данных. Один из видов соревнований — minute sort, в котором необходимо за минуту прочитать с диска и сортировать как можно большее число записей и сохранить результат в файл. Конкурс проходит в двух категориях — Indy, без ограничений на используемое железо, и Daytona — должны использоваться только обычные компьютеры “из магазина”.
Команде Microsoft Research удалось
многократно превысить державшийся с 2009 года рекорд Yahoo в категории Daytona. Их кластер, состоящий из 1033 дисков на 250 машинах, справился с 1401 гигабайтом данных. Это почти втрое лучше результата Yahoo (500 гигабайт), при том, что кластер Yahoo был почти в шесть раз больше (5624 диска на 1406 машинах). Более того, майкрософтовский кластер побил и прошлогодний рекорд в категории Indy (1353 гигабайта).
Немецкие учёные используют модифицированную версию PageRank для сканирования опухолей. Этот алгоритм, NetRank, сканирует гены и белки в клетках и определяет все особенности связей между ними, точно так же, как PageRank сканирует веб-страницы на предмет гиперссылок. Данный подход может помочь в поиске новых способов лечения опухолей.
Внезапно Google объявил о запуске проекта, который готовился в недрах Evil Empire уже два года.
Придумав броский слоган things not strings (вещи — не строчки), нам хотят представить нечто вроде автоматической энциклопедии.
В чем идея?
Обработать ссылки, выданные поисковиком на предмет упоминания в социальных сетях, приложить немного математики и выстроить их в несколько ином порядке чем предлагает гугл. В основе изначально лежал алгоритм по которому высчитывает свои тренды
reddit.com. На самом деле алгоритм достаточно заезжен и многократно описан, но в то же время реально работающий. Проблем состояла в том, что он основан на плюсах и минусах, а у нас изначально только плюсы, то есть мы обладаем только лайками и твитами. Поэтому минусы я заменил количеством посетителей сайта. Идея, если сильно утрировать, примерно та же: количество посетителей минус лайки и чем меньше полученная цифра тем выше ее статус.
После написания
этого поста, меня заинтересовали параметры поиска которые можно использовать, для удобной работы.
Задавшись этим вопросом, в рунете я более менее полной информации не нашел.
Но! Оказывается Google уже давно и для всех,
все показал.
Идея
Искать средствами браузера не только по открытой странице сайта, но и по всему сайту.
Как это должно работать?
- Человек нажимает Ctrl+F и вводит слово для поиска;
- Браузер передает слово сайту;
- Сайт внутренними механизмами* ищет то, что нужно пользователю и передает браузеру сформированный по определенным правилам xml-файл;
- Данные выводятся в привычном для Человека виде.
*вместо внутренних механизмов, могут быть использован поиск гугла, яндекса или другого поисковика.
Корпорация Microsoft старается сделать свой поисковик популярным, и это, надо сказать, ей удается. Во всяком случае, доля рынка этого поисковика растет, хотя и не в геометрической прогрессии. Для того, чтобы привлечь еще больше пользователей, корпорация добавляет в поисковый сервис новые функции. На этот раз было решено добавить систему поиска по Facebook.