Апрель 2008 - Posts

Всё ли помнят слоны? История потерянных писем
30 апреля 08 10:05
В Arstechnica вышла замечательная статья о том как технологии влияют на жизнь и на политику в частности - An Elephant never forgets? George Bush missing emails Если вкратце, то после прихода к власти Джорджа Буша младшего, вместе с ним пришли его люди Read More...
Что закупает государство в ИТ.
30 апреля 08 05:34
Собираю разную интересную статистику по закупкам набрал вот такую интересную подборку. Закупка услуг SEO: Запрос котировочной цены № ЗК-372/08/07 на оказание услуг по продвижению сайта Курсов иностранных языков филологического факультета в поисковых системах Read More...
О Социоранке и социальных сетях
29 апреля 08 04:42
Как и обещал пишу подробнее что же это такое и с чем его едят. Заодно готов ответить на вопросы если они будут. 1. СоциоРанк вовсе не показатель повышенной активности участника сообщества в его жизни, хотя, несомненно эта активность на него влияет. В Read More...
Рамблер.бета - впечатления
28 апреля 08 10:01
Уже после детального опробывания Рамблер.Бета , наконец-то, могу оформить свои впечатления. Ощущения смешанные - с одной стороны есть на что обратить внимание, с другой, неуютное отношение от использования сервиса. 1. Общее впечатление - непроработанный Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
ИТ и предсказания будущего.
28 апреля 08 09:39
В последнее время повелось задаваться предсказаниями того что будет на Земле и в ИТ в частности эдак лет через 25-50 и сколько я их не читаю, убеждаюсь в дном существенном их недостатке. Практически все эти исследования основаны на эволюционной модели Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Ссылки на 26.04.2008
26 апреля 08 02:59
Англоязычные ссылки YouTube - Jurassic Park - Unix System Scene - “Это Юникс! Я знаю Юникс!”. Именно благодаря этому эпизоду есть отчётливое понимание почему же время реакции интерфейса так важно. The new Attack on RDBMS - автор “наезжает” Read More...
Яндекс и Пространства имён в Semantic Web
25 апреля 08 02:52
Сайт Ping the SemanticWeb публикует наиболее часто используемые пространства имён в семантических данных о которых его уведомляют. Подборка большая и, конечно, лидирует http://xmlns.com/foaf/0.1/ так как уведомляют Ping the Semantic Web чаще всего именно Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: , ,
Интеллектуальный анализ поисковых запросов
25 апреля 08 01:12
Пока отечественные компании бороздят просторы развёртки наиболее популярных аббревиатур , тем временем полным ходом появляются поисковые движки проводящие смысловой (семантический) анализ поискового запроса. Рекомендую посмотреть SearchMe Visual Search Read More...
Светлое будущее поиска
24 апреля 08 08:31
Читаю обзор по КИБу относительно поиска. Читать интересно, хотя и местами странно. Например, отношение к проблеме seo-спама которую там упоминает Илья Сегалович меня искренне удивляет. Технически, ограничить индексирование платных ссылок не такая уж сложная Read More...
СоциоРанк в работе
24 апреля 08 06:12
Я писал неоднократно про Социоранк ранее, например тут СоциоРанкинг, кластеры и выявление групп влияния В итоге я всё же пришёл к выводу что любой результат необходимо зафиксировать. Итого по ссылке http://urlus.ru/sociorank/ доступны рассчитанные социоранки Read More...
Ensemble Learning
23 апреля 08 11:31
Продолжая тему участников Netflix Prize и алгоритмов вокруг конкурса - ещё один интересный блог A Beautiful WWW и несколько публикаций в нём посвящённых Ensemble Learning: ETech Presentation on Ensemble Machine Learning Ensemble Machine Learning Tutorial Read More...
Postedfrom Иван Бегтин | 0 Comments    
Добавление данных перебивает алгоритмы
22 апреля 08 11:27
Anand Rajaraman (Ананд Раджаман) интересно пишет о том как использование большего числа данных “бьёт” более продвинутые алгоритмы More data usually beats better algorithms Он приводит хороший пример с Adwords и его сравнение с Overture. По Read More...
Государственные и общественные машапы
19 апреля 08 10:14
В догонку к тому о чём я хотел упомнуть на РИТ’е, но уже нехватило времени - раскрытии государством информации и результатам этого раскрытия. В del.icio.us пользователь duchessanna собрал(-а) несколько десятков закладок на gov_mashups . Практически Read More...
Hive: Hadoop для BI и Data Mining
19 апреля 08 09:34
Ранее я рассуждал о применимости Hadoop и HBase для корпоративного рынка , и вот подтверждение моих мыслей. В презентации которая была на саммите Hadoop в марте представители Facebook рассказывали про Hive - data warehouse на основе Hadoop’а. Меня Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: , , ,
Информация vs. Технологии
18 апреля 08 04:41
Я ранее уже писал о конкуренции между технологическими и информационными компаниями и, развивая тему, в чём же специфика этой конкуренции. Далее пойдут размышения, которые многим могут показаться банальными, но тем не менее. На мой взгляд корень этой Read More...
“Шинглопринтинг”. Материалы и по выявлению близких подобий
18 апреля 08 08:11
Ссылки: Simhash - шинглопринтинг в виде реализации на C Methods and apparatus for estimating similarity - патент Google от 2 января 2007 года Detecting near duplicates in big data (PDF) применение методов выявления близких подобий для _очень больших_ Read More...
Англоязычные ссылки на 15.04.2008
15 апреля 08 09:37
Oklahoma Leaks Tens of Thousands of Social Security Numbers, Other Sensitive Data - сегодняшний анлоязычный WTF жжот. Этот пример можно вносить в учебники для веб-программистов как нельзя публиковать данные в сети. Не буду раскрывать подробностей - смотрите Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
3D фотографии улиц по китайски
15 апреля 08 10:40
Китайский проект city8.com , фактически аналог Google Street view, но для китайских городов. Вообще у китайцев много интересного делается (и копипастится), другое дело что языковой барьер мешает даже узнать об этом. А сам сервис интерен и тем что реализует Read More...
Транспорт. Русавтобус
11 апреля 08 07:51
Пример сайта сделанного хорошо как по идее, так и по исполнению - http://msk.rusavtobus.ru/ Рассчитывают маршруты передвижения по Москве учитывая _Весь_ общественный транспорт включая метро, троллейбусы, трамваи, автобусы и т.д. Буквально, то о чём я Read More...
Postedfrom Иван Бегтин | 0 Comments    
14-15 апреля буду на РИТ-2008
11 апреля 08 06:37
На РИТ я буду докладывать на Success Story 2008 про наш проект Енот Поискун , в теме “Как работать с государством?” - как начиналось, во что превратилась в чём “специфика” и тому подобное. Пока в планах было провести на РИТ весь Read More...
Postedfrom Иван Бегтин | 0 Comments    
TruckNumber - ЧислоГрузовика
10 апреля 08 10:31
Первое определение ЧислоГрузовика - это размер наименьшей группы людей в проекте, которые если все вместе попадут под грузовик, то у проекта будут проблемы В оригинале: The TruckNumber is the size of the smallest set of people in a project such that, Read More...
О спаме тезисно и с примерами. Часть 2.
10 апреля 08 05:37
1. Наблюдение последних дней резкое увеличение числа типового почтового спама с визуально заметными искажениями текста вроде вставки символов { и _ между букв. Текст становится предельно нечитаемым и визуально однозначно определяемый как Спам. Интересно Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Структуры данных и их анализ. Сугубо техническое
10 апреля 08 09:59
Я периодически публикую записи о том как выявляются платные ссылки - это что-то вроде хобби, довольно непростая задача, со множеством весьма нетривиальных выводов, к счастью, в ней оказалось меньше необходимости в сложных мат. формулах, во всяком случае Read More...
Ссылки на 08.04.2009. Поисковые трюки и не только.
08 апреля 08 10:40
Customize Google Firefox Extension - расширение для Firefox меняющее привычный вид Google. Настроек невероятное количество, включая изменение шрифтов, удаление счетчиков, возможность искать через другие поисковики на странице результатов поиска и, что Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Правы ли в Yahoo сопротивляясь поглощению?
08 апреля 08 10:56
Читаю статью в Business Week “Is Yahoo right to Resist Microsoft?” Там поднимается сразу несколько вопросов и ответов на них о том почему же Янг и руководство компании так упорно сопротивляется поглощению. Пожалуй, самое интересное - это два Read More...
Обработка данных и Data mining. Ссылки
03 апреля 08 11:03
NetFlixPrize - конкурс по обработке предпочтений пользователей фильмов для определения взаимосвязей между ними и возможности предсказания того какие фильмы пользователи предпочтут по их интересам. Подробности лучше прочитать на сайте, равно как и обратить Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Материалы по мониторингу официальных сайтов по госзакупкам
03 апреля 08 08:47
Для тех кто читает и интересуется темой -в 11-м номере журанала “Госзаказ” на 118-119 страницах вышла статья в соавторстве меня и Михаила Потемкина посвящённая мониторингу официальных сайтов по госзакупкам в части информационного обеспечения. Read More...
Антиспам. Тезисные рассуждения
03 апреля 08 08:24
1. Любой тип спама - суть паразитическое явление. Спам может существовать исключительно поскольку с ним борятся, поскольку как только защитные меры перестают предприниматься, спам может разрушить само функционирование той среды в которой он находится. Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Cсылки на 2.04.2008
02 апреля 08 09:22
ZitGist - один из первых стартапов предлагающих продукты по экспорту данных в структурированном виде (практически Semantic Web), их просмотру и публикации в Linked Data. OOXML принят как международный стандарт - для кого-то ложка дёгтя, для кого-то радостная Read More...
Лингвистика, работа с текстом и частотный анализ
02 апреля 08 01:19
По рзеультатам одонго орпоса слато пноятно. Не иемет занчнеия, в кокам пярокде рсапожолены бкувы в солве. Галвоне, чотбы превая и посляендя бквуы блыи на совём мсете. Читая материалы по статистике частоты употребления слов в русских и английских текстах Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:

This Blog

Tags

Archives

Syndication