Comments / Profile of texamus / Habr

How to become an author

texamus @texamus

User

Profile Publications 21Comments 95Bookmarks 22

Google, Twitter и iPad

texamus Apr 16 2010 at 00:06

Да, с machine learning можно много интересных вещей делать. Гугл так грипп определяет по запросам, у них каждую осень такая страничка по регионам появляется. С биржами тоже, наверное, люди работают, но не афишируют это громко.

+1

Пишем игру Реверси на Python + PyQt4

texamus Mar 11 2010 at 00:47

в 548 строчке можно заменить math.trunc на int и тогда код будет работать и в Python 2.5 (иначе только 2.6)

0

Популярность языков по stackoverflow

texamus Mar 3 2010 at 00:44

А вы знаете, что *всю* информацию сайта можно официально скачать по торрентам и датамайнить по самые не хочу:

blog.stackoverflow.com/category/cc-wiki-dump/

(до марта 2010 дампы имеются)

+1

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 16:14

Пожалуйста. Все существенное я продублирую в почтовой рассылке.

0

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 15:58

выслал, но они обычно идут несколько дней

+1

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 14:23

до завтра в посте дам ссылку, где будет код, вы сможете его форкнуть и развивать

0

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 12:28

да, я к такой мысли склоняюсь — не зря ведь за котят какую-то копеечку платят

код все же выложу, а на аукцион, наверное, пойдет домен

0

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 12:21

если есть желание участвовать в коллективном обсуждении, пожалуйста, заполните форму
spreadsheets.google.com/viewform?formkey=dEZ1dlBlVFpmU09peS15UUx0aGNNM2c6MA

0

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 12:08

если есть желание участвовать в коллективном обсуждении, пожалуйста, заполните форму spreadsheets.google.com/viewform?formkey=dEZ1dlBlVFpmU09peS15UUx0aGNNM2c6MA

0

TalkLike.com — отдам в хорошие руки

texamus Feb 16 2010 at 12:07

если есть желание участвовать в коллективном обсуждении, пожалуйста, заполните форму spreadsheets.google.com/viewform?formkey=dEZ1dlBlVFpmU09peS15UUx0aGNNM2c6MA

0

TalkLike.com — отдам в хорошие руки

texamus Feb 15 2010 at 23:54

Свяжусь завтра по хабрапочте.

0

TalkLike.com — отдам в хорошие руки

texamus Feb 15 2010 at 23:53

Отлично!
Так как желающих несколько, то кажется лучшим обсудить это коллективно.

0

TalkLike.com — отдам в хорошие руки

texamus Feb 15 2010 at 23:52

Завтра свяжусь через хабрапочту.

0

TalkLike.com — отдам в хорошие руки

texamus Feb 15 2010 at 23:52

Спасибо.
Я добавил Update в тело записи.
До завтрашнего вечера разберемся как быть.

0

TalkLike.com — отдам в хорошие руки

texamus Feb 15 2010 at 21:21

да, они как раз перевод субтитров около 9 месяцев назад ввели :)

все же фишка прототипа в том что субтитры на двух языках идут параллельно, как у Франка

+3

Анализ социального графа

texamus Jan 22 2010 at 20:13

identi.ca/ — аналог твиттера, полностью открытый и распределенный, пока массами не принимаем.

В декабре некоторые новостные сервисы шумели о том что wordpress.com а потом tumblr.com реализовали Twitter API. То есть Twitter API постепенно становится стандартом. Не знаю до какой степени социальный граф можно привязать в этих двух сервисах.

Facebook, в принципе, дает доступ к графу через API. Тут проблема в том что можно по настоящему считать проявлением социального графа. В заметке я выделял тех, кто общается и упоминает, а не фоловит. В Facebook тоже имеет смысл выделять тех, кто отмечен на одной фотографии, пишет на стену… Только такие вещи часто закрыты пользователями.

ЖЖ тоже дает некий граф, но из него все надо делать руками (не через API), хотя может быть я просто не знаю о его существовании.

Вот еще один интересный проект от Google (API объединяющий многие социальные сети)
code.google.com/apis/socialgraph/

…

0

Анализ социального графа

texamus Jan 19 2010 at 18:03

В моей потоке промелькало упоминание Fred Wilson :)

Все же не расстраивайтесь так. Это бизнес. Любопытный пример маркетинга.

0

Анализ социального графа

texamus Jan 19 2010 at 17:42

Все же и вы меня не совсем так поняли.

Поясню на примере. Если человек ставит целью считать PageRank страниц в Интернете — это развлечение. Если потом это число используется чтобы более авторитетные страницы всплывали в поиске — это польза.

Или еще. Если человек категоризирует страницы по ключевым словам — это развлечение. Если потом на основе этих ключевых слов на этих страницах продается реклама — это польза.

Если в твиттере строятся рейтинги, выделяются группы и т.п. — это развлечение. Если на основе этого что-то еще происходит — это может быть пользой.

У меня есть мысли о том что может быть пользой для этих упражнений, но они пока зреют.

0

Анализ социального графа

texamus Jan 19 2010 at 16:57

Все же получаемая информация носит больше развлекательный характер. Навряд ли она того стоит :)
Если найдутся желающие — пожалуйста, пользуйтесь кодом.

0

Анализ социального графа

texamus Jan 19 2010 at 16:52

Другие сообщества не смотрел, т.е. не больше 250 узлов.

Код на C++ для расчета кластеризации, который выложила бельгийская группа, использовался в их статье arxiv.org/abs/0803.0476 Там они проанализировали бельгийского оператора сотовой связи (2.6 миллиона узлов). И веб-граф с 118 миллиона узлами.

О требованиях к памяти не задумывался, но, скорее всего они пропорциональны сумме числа узлов и ребер, т.к. модулярность оптимизируется более-менее локально.

В этих упражнениях мною двигало любопытство, а чтобы браться за большие графы должно быть видение какой-то выгоды, пока его особенно нет.

На GAE не запускал. Все-таки не вижу это как единое веб-приложение, а как набор скриптов для анализа. Еще и много сторонних библиотек.

0

3