Май 2008 - Posts

US. Обязательное раскрытие финансовой информации в XBRL
31 мая 08 11:22
Прочитал эту новость несколько дней назад и всё искал подробности и подтверждения. Комиссия по торговле ценными бумагами США вводит обязательное требование по раскрытию публичных отчётов компаний в машиночитаемом и структурированном формате XBRL (eXtensible Read More...
Формы общения и формализация
31 мая 08 06:40
Прошлый раз я писал о разнице в восприятии между электронным письмом и голосом, на сей раз будет тема отличий между общением электронными письмами, голосом и общением вживую. Многое из того о чём я буду писать может показаться очевидным и так и должно Read More...
Формы общения и формализация
31 мая 08 06:40
Прошлый раз я писал о разнице в восприятии между электронным письмом и голосом, на сей раз будет тема отличий между общением электронными письмами, голосом и общением вживую. Многое из того о чём я буду писать может показаться очевидным и так и должно Read More...
Информационные потоки, скрытая информация и связность
30 мая 08 11:06
Предупрежу заранее - это будет длинный текст, по принципам работы с информацией, причём не последний из этой темы поскольку за один раз всего не охватить. Рассмотрим некоторые вопросы: Как мы думаем когда мы думаем? Влияет ли то о чём мы думаем на то Read More...
Об онлайн голосованиях. Средства борьбы с роботами
29 мая 08 05:17
В качестве преамбулы. Вчера я весь день провёл на “II международном форуме” «ГОСУДАРСТВЕННЫЕ ЗАКУПКИ: ПЕРСПЕКТИВЫ РАЗВИТИЯ»”. Интересного довелось услышать много, а кое что даже и самому рассказать в теме методов прозрачности госзаказа. Read More...
Ответы на вопросы
27 мая 08 10:43
В последнее время мне задают очень много одинаковых вопросов, так что я решил собрать их все вместе в виде ответов. Это не N фактов о себе, а просто возможность не повторяться. 1. Я очень редко использую ICQ, Skype и любые другие пожирающие время мессенжеры. Read More...
Postedfrom Иван Бегтин | 0 Comments    
Социальный рейтинг как спам фильтр
27 мая 08 09:48
Мысль пока не оформившаяся у меня в окончательное видение - пока только как идея и алгоритм выявления сплогов на блогоплатформах (LJ, Blogger или Community Server) с одной стороны блокирующая спам боты с другой подталкивающая пользователей к активности. Read More...
Социоранк. Что есть и как развивать
26 мая 08 10:25
Возвращаясь к Социоранку ( http://urlus.ru/sociorank/ ), моему небольшому и , имхо, полезному некоммерческому проекту - есть желание его улучшить, сейчас осмысливаю варианты как это можно осуществить. Что есть: - методика расчёта тематического рейтинга Read More...
Умственная гигиена
25 мая 08 09:15
Из правды мат не вырежешь, а в журнале flying_bear обнаружилась отличная история. В Новосибирске, двадцать с лишним лет назад. Разговариваю с парнем, только что закончившим университет, очень толковым (и, действительно, стал потом хорошим физиком), про Read More...
Англоязычные ссылки с комментариями. Базы данных
24 мая 08 09:36
NodeDB - Python implementation of CouchDb like database - альфа версия и первая попытка воспроизвести возможности CouchDB на Python. Почему бы и нет, что может Erlang чего нельзя сделать на Python? Multi-Inflection Point Alert - некоторые размышления Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Анализ ссылок - окончательные итоги
22 мая 08 07:21
Подводя черту под всем что я ранее писал про выявление поискового спама, задачи которую я лично рассматриваю лишь как малое подмножество понимание связей между ресурсами вцелом и автоматической структуризацией информации, так вот итоги которые я могу Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Rails vs. Django
21 мая 08 08:39
Интересное 25-страничное исследование-сравнение платформ Ruby-on-Rails и Django. Что хорошо так то что автор разобрал и сравнил особенности фреймворков весьма детально и каждой выставленной оценке привёл обоснование. При том что я считаю что у Django Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Полнота модели vs. частные решения
21 мая 08 06:15
Чем больше я читаю исследований по работе с информацией в самых разных формах - алгоритмы поиска, разпознавания музыки, голоса и изображений, тем более убеждаюсь в верности того утверждения что больше данных, действительно, бьёт лучшие алгоритмы. При Read More...
Дополнительные результаты по выявлению поискового спама
20 мая 08 11:55
Для социальных сайтов (соц. сети, форумы, чаты) выборка в 33 сайта http://docs.google.com/View?docID=ddtpj46_285gx343bcj&revision=_latest Для государственных веб ресурсов - 201 сайт http://docs.google.com/View?docID=ddtpj46_2846s93jvd4&revision=_latest Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Выявление платных ссылок. Результаты по новостным сайтам
20 мая 08 12:36
Для тех кто интересуется темой, последние результаты проверки 56 новостных сайтов с последующей ручной перепроверкой и анализом результатов. Про то как работает сам алгоритм меня можно не расспрашивать, остальное в документе результатов. http://docs.google.com/Doc?id=ddtpj46_283gbbvs9g6 Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under: ,
Слух: Интел может купить Vmware и некоторые сопутствующие размышления
19 мая 08 09:52
Вначале новость на bloomberg.com о том что возможно что кто-то (кто не сказано) заинтересован в покупке Vmware, а потом продолжение слуха у Alexandro Perilli в virtualization.info и важное уточнение - покупателем может выступить Интел. Имеет смысл вспомнить Read More...
Рассуждения о социальных сетях
17 мая 08 10:43
Тезисные размышления и вопросы по социальным сетям и не только. 1. Блог ли, аккаунт ли в социальной сети или на любом другом сайте - это не сам человек, а лишь его воплощение или цифровой образ. Любые социальные отношения данного человека в отношении Read More...
Копирайт и копипаст - 2. Чем отличается lj.ru от сплога?
14 мая 08 05:21
Теперь я хорошо понимаю city_rat с его иском к Супу по поводу трансляции его записей на livejournal.ru. Сегодня туда же попала моя запись - “ Как искать в Интернете ” при том что, разумеется, никаких разрешений на публикацию там я не давал. Read More...
От сложного к сложному.
14 мая 08 08:01
Я в последнее время часто привожу примеры из анализа лингвистических и других данных, иногда я буду приводить их и дальше, смысл в них и применимость не в конкретно лингвистике, а в принципиальном подходе - формирование максимально исчерпывающей онтологии Read More...
Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Как находить нужную информацию в сети
13 мая 08 11:34
Поскольку практически постоянно я лично ищу нужные мне материалы, темы и исследования со времением всё это накопилось в набор рецептов которые могу порекомендовать тем кто хочет не просто периодически читать о чём-то интересующем, но создать условия что Read More...
Powerset и корпоративный поиск
13 мая 08 08:55
Сегодня Powerset запустили свой поиск в публичный доступ и он сразу же перестал работать, похоже лёг под нагрузкой. Любопытно что не все предрекают PowerSet’у столь уж безоблачное будущее в Интернет-поиске, например, интересные обсуждения в блоге Read More...
Копирайт, спам и блоги
12 мая 08 09:03
Надо отдать должное поисковикам - найти “контентных воров” через них куда проще чем чем как-либо ещё, правда связано это не с качеством поиска, а с недостатным качеством - так как из индексной базы поисковика такие спамеры не исчезают иногда Read More...
Слова и буквы в контексте информационной модели
12 мая 08 11:01
Что такое ветер - это небо. Юрий Шевчук Вопрос - что такое слово ? Обычное слово, в предложении, суть буквы и ничего более. Конечно слово - это часть речи, может быть представлено родом и склонением, глаголы имеют спряжения и так далее. Рассмотрим слово Read More...
Postedfrom Иван Бегтин | 0 Comments    
Лингвистические трюки и распознавание национальности по имени
11 мая 08 02:49
вопросам о том какую информацию можно извлечь из такого простого понятия как личное имя. Специфика личного имени человека в его происхождении, причём для разных народов, этносов даже в рамках общей среды обитания выбор имени всё ещё остаётся национальной Read More...
Postedfrom Иван Бегтин | 0 Comments    
Поисковый антиспам. Алгоритмы
08 мая 08 05:17
Продолжая тему борьбы с поисковым спамом, основные направления я уже описывал по отдельности, чуть подробнее о всех вместе, на основе публично доступных материалов. 1. Анализ хостграфов и плотности PageRank Подход на 100% математический и требующих больших Read More...
Лингвистика. Частотный анализ - 2.
07 мая 08 01:43
Ранее я писал про работу с текстом и частотный анализ , например, то что при наличии первой и последней буквы и перемешанных остальных слово прочитать возможно. Несмотря на сомнения некоторых читателей, я всё же ещё раз хочу подтвердить - для того чтобы Read More...
Программирование для историков
04 мая 08 10:52
Два канадских учёных и историка пишут монографию - Programming History. При этом все материалы доступны онлайн http://niche.uwo.ca/programming-historian/index.php/Main_Page Подход интересен - программирование приводится не как профессия, а как приготовление Read More...

This Blog

Tags

Archives

Syndication