Июнь 2008 - Posts

n/a
30 июня 08 12:04
Я упоминал об этом ранее в в различных записях по системам госзакупок, но по дальнейшему наблюдению приходится отметить что проблема глубже какой-либо конкретной области. Что такое целостность формы? Целостность формы - это когда рассматриваемая единица Read More...
Ссылки по формам и принципам работы с информацией. Онтологии и находимость.
29 июня 08 01:43
Прежде чем продолжать рассуждения по анализу информации как в виде потоков, приведу несколько ссылок на схожие рассуждения и их основу. О проблемах выявления неполноты и избыточности в онтологических пространствах объектов исследования - заметка о онтологиях Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Мир как поток и совокупность информации. Часть 3.
26 июня 08 01:03
В предыдущих двух частях: часть 1 и часть 2 я описывал информационные потоки в общем случае, а также некоторые их метрики. В этой части я заторону подробнее такое понятие как информационный массив, конечно, в контексте информационных потоков. Информационный Read More...
Статья на Cnews про zakupki.gov.ru
25 июня 08 11:52
Cnews.ru меня опередили, наверное потому как их редактора читают мой блог;), и я рекомендую посмотреть вот эту статью на их сайте практически всё там написанное чистая правда. Выражения заказчиков даже смягчены и мне бы не хотелось приводить их дословно, Read More...
Государство и ИТ. Почувствуйте разницу
25 июня 08 09:09
Пока у меня копятся впечатления про новую версию zakupki.gov.ru и набираются материалы по следующей статье “Мир как поток и совокупность информации”, не могу не поделиться парой ссылок. 1-я - приведённый выше zakupki.gov.ru разработки Норбит/Ланит Read More...
Microsoft Office и ODF. Оценка причин
24 июня 08 09:15
Блоги и издания полны упоминаний о высказываниях Стюарта МакКи по поводу поддержки ODF в следующем сервис паке к Microsoft Office. Собственно по ссылке, оригинальная статья в Infoworld . Собственно а кто такой Джон Галт Стюарт МакКи? Стюарт МакКи - это Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Мир как поток и совокупность информации. Часть 2
22 июня 08 12:39
В первой части я писал о восприятии информации в рамках модели событие-факт и о понятиях информационного потока и связанных с ним явлений. Далее я подробнее остановлюсь на структуре и метриках информационных потоков. Одна из основных задач при отделении Read More...
Мир как поток и совокупность информации. Часть 1
20 июня 08 10:54
Несколькими постами ранее я задавался вопросами о том сколько же информации средний человек производит в сутки и делал утверждения что общий объём информации в мире конечен. Убеждённости в конечности информации, я придерживаюсь и поныне, важно уточнить Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Уходы из Yahoo и слухи о изменениях в Яндексе
20 июня 08 08:47
BusinessWeek пишет что Yahoo покидает сразу несколько известных в поисковом мире людей - Vish Makhidjani, Brad Garlinghouse и Qi Lu. Подробнее в статье Yahoo’s Executive Brain Drain Continues Что более всего интересно так это слухи что Vish Makhidjani Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Подробнее Rambler.Beta с точки зрения работы с информацией
18 июня 08 08:55
Начну с того что проект мне лично интересен тем что я и сам плотно занимаюсь вопросом фокусированного индексирования и структуризации данных (Focused Indexing and Feature Extraction) и новинки по теме всегда любопытны. Коротко я по этой теме уже писал Read More...
Postedfrom Иван Бегтин | 0 Comments    
Госзакупки. Проблема 2010
17 июня 08 05:56
Невозможно решить проблему на том же уровне, на котором она возникла. Нужно стать выше этой проблемы, поднявшись на следующий уровень. Альберт Эйнштейн Как обещал пишу впечатления накопленные по конференции по госзакупкам и мои размышления по этой теме. Read More...
Thrudb - универсальное хранилище документов
15 июня 08 10:33
Читая материалы по document-based и column-based базам данных наткнулся на довольно интересный проект Thrudb eng . Что его выделяет является надстройкой между условно-любым хранилищем, в частности над Amazon S3, а также что Thrudb может быть развёрнут Read More...
Непонятная судьба Yahoo!
15 июня 08 02:42
Хотя лично я всё это время оставался скептиком поглощения Yahoo! со стороны Microsoft, тем не менее последние события и то что Yahoo! решились на сделку с Google по показу их рекламы, на мой взгляд, предрешает судьбу компании. Даже несмотря на то что Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Кириллические домены .рф и .ру - отдать нуждающимся
12 июня 08 12:45
Хотел написать по теме длинно и пространно и бросил эту затею, много времени оно не стоит. В итоге решил изложить мысли коротко и тезисно. 1. Доменные зоны .ru и .su, мягко, говоря себя ещё не исчерпали и практическая необходимость в кириллических доменах Read More...
Social Media in Plain English
09 июня 08 02:06
Отличный ролик на YouTube показывающий что такое social media - http://www.youtube.com/watch?v=MpIOClX1jPE А производит такие ролики Common Craft - у них же есть ролики на тему блогов, RSS, подкастига и так далее. Кросспост из Иван Бегтин . Комментарии Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Интересные англоязычные ИТ блоги
09 июня 08 02:01
Machine Learning (Theory) - групповой блог сотрудников Yahoo по машинному обучению. RedMonk - сайт и блоги аналитиков RedMonk. Один из лучших источников новостей и их анализа в мире пересечения корпоративного рынка и Open Source MSDN: Brian Jones (Open Read More...
Проблема работы с неструктурированными данными
07 июня 08 08:40
Не так давно читая материалы по Apache UIMA (Unstructured Information Management applications) я удивлялся зачем нужно такое переусложнение? Да и форма подачи документации UIMA, простоты не подразумевает, для любых частных задач проще создать частный Read More...
Раздача датасетов - домены с геокодами
05 июня 08 02:14
Может быть интересно для тех кто работает над определением гео-расположением веб сайтов - выкладываю небольшой датасет в 5000 ресурсов в зонах .ru и .su. Он доступен по ссылке - http://urlus.ru/static/research/ru_5000.csv.gz (37 KB) Структура CSV файла: Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Geotagging - заблуждения и размышления
03 июня 08 06:39
Углубившись в тему ещё немного убеждаюсь что в ней как и во многих других классификационных задачах популярны заблуждения приводящие к неверным выводам. Так назначение гео-меток - это не только поиск географических названий, это ещё и анализ принципиальной Read More...
Англоязычные ИТ ссылки на 3.06.2008
03 июня 08 02:36
Infoworld. The shrinking Java tools market - инструментов для Java платформы всё ещё много, но уже становится меньше чем раньше. New Wares Bridge Java and .NET - всё больше инструментов для связи Java и .NET продуктов. Платформы устоялись, заняли свои Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Geotagging результаты
03 июня 08 10:39
Результаты по завершившейся за ночь задачке. Анализировалось суммарно 10 000 сайтов в .ru и .su. 1. Всего удалось определить регион для 9594 сайтов. Итого полнота (recall) ~ 96% 2. Из них 60% - это Москва. Московских сайтов 6043 от общего числа. 3. Около Read More...
Geotagging. Ссылки
02 июня 08 09:06
Ссылки на память, материалы по теме: Некоторые способы определения географической привязки IP адресов - контентный алгоритм на русский по гранту Яндекса Web-a-Where - материалы из Израильского подразделения IBM Design and Implementation of a Geographic Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Automatic Geotagging experiments
02 июня 08 05:38
Продолжая тему работы с информацией и нетривиальной классификацией, на прошедших выходных я решил поставить эксперимент. Перечитав работу сотрудников Яндекса - Automatic Geotagging of Russian Web Sites я таки решился на эксперимент и поставил сам себе Read More...
Postedfrom Иван Бегтин | 0 Comments    
Automatic Geotagging experiments
02 июня 08 05:38
Продолжая тему работы с информацией и нетривиальной классификацией, на прошедших выходных я решил поставить эксперимент. Перечитав работу сотрудников Яндекса - Automatic Geotagging of Russian Web Sites я таки решился на эксперимент и поставил сам себе Read More...
Postedfrom Иван Бегтин | 0 Comments    
Исправление опечаток. Понимание подходов
01 июня 08 02:42
Недавно, заинтересовавшись темой опечаток, искал материалы исследований по этой теме. Мне на глаза попался документ исследования по исправлению опечаток в географических названиях и по словарю http://rcdl2007.pereslavl.ru/papers/paper_25_v1.pdf и ряд Read More...

This Blog

Tags

Archives

Syndication