Август 2010 - Posts

О реестре недобросовестных поставщиков и недостоверной информации. Много и подробно
30 августа 10 08:44
Поскольку я ответа от представителей ФАС так и не получил, но обнаружил что большую часть примеров что я им прислал они «тихо поправили». Скажу честно, такое отношение к делу мне не нравится, но я к нему был заранее готов. Так что придётся всё таки публиковать у себя, максимально подробно.  По крайней мере с моей стороны все приличия были соблюдены.</p>

Для начала,  что такое реестр недобросовестных поставщиков, он описан в статье 19 94-ФЗ:

2. В реестр недобросовестных поставщиков включаются сведения об участниках размещения заказа, уклонившихся от заключения государственного или муниципального контракта, а также о поставщиках (исполнителях, подрядчиках), с которыми государственные или муниципальные контракты по решению суда расторгнуты в связи с существенным нарушением ими государственных или муниципальных контрактов.
3. Реестр недобросовестных поставщиков должен содержать следующие сведения:
1) наименование, место нахождения (для юридических лиц), фамилия, имя, отчество, место жительства, идентификационный номер налогоплательщика лиц, указанных в части 2 настоящей статьи;
2) дата проведения аукциона, подведения итогов конкурса или итогов проведения запроса котировок в случае, если победитель аукциона, победитель конкурса или победитель в проведении запроса котировок уклонился от заключения государственного или муниципального контракта, дата признания несостоявшимися торгов, в которых единственный участник размещения заказа, подавший заявку на участие в конкурсе или заявку на участие в аукционе, либо участник размещения заказа, признанный единственным участником конкурса или аукциона, либо участник аукциона, единственно участвующий в аукционе, уклонился от заключения государственного или муниципального контракта, дата проведения запроса котировок, в котором единственный участник размещения заказа, подавший котировочную заявку, отказался от заключения государственного или муниципального контракта, дата заключения неисполненного или ненадлежащим образом исполненного государственного или муниципального контракта;
3) предмет, цена контракта и срок его исполнения;
4) основания и дата расторжения государственного или муниципального контракта в случае расторжения контракта в связи с существенным нарушением поставщиком (исполнителем, подрядчиком) контракта;

—-
А также реестр недобросовестных поставщиков регулируется 292 постановлением правительства от 15 мая 2007 года.
Если внимательно прочитать закон и постановление, то можно обратить внимание что:
1. Нигде не упомянут механизм (регламент) проверки наличия поставщика в реестре госзаказчиком.
2. Можно обратить внимание что в требованиях к той информации которая вносится в реестре нет требований к проверки её на достоверность.
Итак а теперь в чём проблемы в реестре недобросовестных поставщиков. Здесь есть две категории проблем.
Проблемы практические – касающиеся того как реестр ведётся прямо сейчас, и проблемы принципиальные – то как реестре должен был бы быть устроен «правильно». Сейчас я остановлюсь только на практических проблемах, они достаточно актуальны.
На  практике госзаказчике проверяют поставщиков на наличие в реестре по двум критериям. По реквизитам поставщика – идентификационному номеру налогоплательщика и по названию организации. Что означает что эти данные в реестре должны быть достоверными.
А теперь представим себе ситуацию что в данных которые заказчик передал в территориальные УФАС закрались ошибки, случайные ли, или намерянные (как отличить?), но ошибки. Например, в названии организации есть опечатка или же ИНН записан неверно и в таком виде эта информация попадёт в реестр.  И,  как результат, если другой госзаказчик будет проверять ту же информацию по реестру он этой организации там не найдёт. Полагаете надуманная ситуация? Как бы не так.
Обратимся к информации в реестре поставщиков и рассмотрим конкретные примеры:

Пример N1. ИНН введён не полностью или наоборот избыточно.
По ссылке можно увидеть реестровую запись о внесении Шишова Андрея Олеговича http://rnp.fas.gov.ru/RNPCard.aspx?id=98c4974e-60fd-453b-8355-7640d60c2603
Однако вы можете обратить внимание что его ИНН состоит из 10 цифр – 6503078914, а не из 12 каким должен быть ИНН у физических лиц.
Итого если кто-то будет проверять данного поставщика  по его настоящему 12-значному ИНН, то, разумеется, он его не найдёт.
Другой пример, запись об ООО «Символ» http://rnp.fas.gov.ru/RNPCard.aspx?id=0cf71bbb-0c55-45b8-b6cf-46b1c40166b8 включает ИНН 18270172235 из 11 цифр, которого, конечно, никак не может быть у ООО. Да и вообще такого кода ИНН не может быть.
Пример N2. ИНН организации не проходит валидацию и отсутствует в ЕГРЮЛ.
По ссылке можно увидеть запись о ООО «Абсолют строй» http://rnp.fas.gov.ru/RNPCard.aspx?id=5e0e7fb2-1b92-4c15-8804-7ae9e12d1ad1 с кодом ИНН 7813308543. Так вот данный код ИНН некорректен и отсутствует в ЕГРЮЛ в чём можно убедиться здесь http://egrul.nalog.ru/fns/
Другой похожий пример ООО «Возрождение» и Удмуртии http://rnp.fas.gov.ru/RNPCard.aspx?id=d2d8c035-e029-4df3-aa58-4dcd84955dd9 с кодом ИНН 1834045253. Который, как Вы уже догадались, отсутствует в ЕГРЮЛ с данным ИНН. Однако если подробнее поискать в том же ЕГРЮЛ, то можно найти эту же организацию по тому же адресу с кодом ИНН 1834045258.  То есть при внесении в реестр недобросовестных была совершена всего лишь одна опечатка в последней цифре кода, но в результате находимость организации по ИНН теперь нулевая.
Пример N3. ИНН организации не соответствует её названию
Это более сложный случай чем предыдущие когда код ИНН одной организации может, на самом деле, принадлежать другой.  Или же когда организация может сменить своё название.
Например, ООО «СтройПроектМонтаж» из Новосибирской области находится в реестреhttp://rnp.fas.gov.ru/RNPCard.aspx?id=7c723330-fdad-43ed-ab09-7c121d45c7d0. Однако если сейчас заглянуть в ЕГРЮЛ и поиска организацию с ИНН 5405161277 то мы найдём организацию «Лотос М». Если заказчик проверял наличие поставщика в реестре именно по названию, то организацию с названием «Лотос М» он там не найдёт.
Вопрос в том является ли это название «Лотос М» новым названием этого юр. лица или же СтройПроектМонтаж было изначально неверным названием организации. Это невозможно проверить кроме как не подняв исторические данные об организации из ЕГРЮЛ.
Пример N4. Латиница в названиях организаций
В реестре недобросовестных может быть точно такая же проблема что и с закупками. Если в названии поставщика были использованы латинские символы вместо кириллических, то и госзаказчик ищущий поставщика по названию может его не найти.
Увы этот пример будет исключительно умозрительный. Те несколько случаев которые были мной найдены, я ранее пересылал сотрудникам ФАС России и теперь уже их нельзя привести наглядно поскольку они успели быстро их поправить.
В основном это были простые ошибки, например, вместо «ООО» русскими буквами было написано латинскими, кое-где вместо русской буквы «Эс» использовалась латинская «Цэ».
Пример 5. Опечатки в названиях
Этот пример также умозрительный, не из-за невозможности, а из-за сложности проверки. Если латиницу в названиях организаций ещё хоть как-то можно выявить, то если кто-то ошибётся в названии организации. Особенно если ошибка будет невелика и, например, всё же сохранит смысл слова, то организацию поставщик, опять же будет невозможности найти по названию. Окончательно убедиться  в этом будет можно только сопоставив название организации из ЕГРЮЛ с названием в реестре недобросовестных. И, хотя это и займёт немало времени, это ещё может быть сделано.
—-
Примеры  Выше это не единичные случаи. Разумеется подобных случаев гораздо больше, особенно некорректно введённых кодов ИНН. Десятки случаев.</p>

Отсюда вопрос относительно того как же именно госзаказчики должны проверять наличие поставщика в данном реестре – по реквизитам (коду ИНН) или по названию? Получается что в любом из этих способов есть риск что поставщик, даже если он был внесён в реестр, может быть не найден.
Другой немаловажный вопрос в том как же возникла такая ситуация. Проверяют ли вообще сотрудники антимонопольной службы информацию которую они вносят в данный реестр?
К великому моему сожалению, вся данная ситуация показывает работу Антимонопольной Службы не в лучшем свете. Даже если мы предположим кристальную честность сотрудников данной службы, то отсутствие контроля за той информацией которая вносится в реестр ставят ФАС России на одну ступень с заказчиками «случайно»  использующих латиницу в госзаказах.

Приложение к посту. Письмо которое уходило в ФАС (значительная часть там написанного ими уже поправлено)

—————-

Прежде чем публиковать у себя в блоге, как обещал, пересываю Вам результаты моего анализа реестра недобросовестных поставщиков.
Вот некоторые примеры из реестра недобросовестных:
1. Проблема с реквизитами индивидуальных предпринимателей
Например, в некоторых случаях для ИП’шников у которых должен быть ИНН из 12 цифр, в реестре этот код состоит из всего 10 цифр. А то есть в нём либо потеряны 2 цифры, либо это вообще не их ИНН.
Примеры:
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=98c4974e-60fd-453b-8355-7640d60c2603
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=37aac1fa-41c9-4e6c-8ac5-07c2685e2f5b
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=0e36065c-1ea1-46c3-ae16-d0f38419aeb5

Всего таких 9 случаев.</p>

2. Проблема с корректностью кода ИНН у юридических лиц.
У ряда юридических лиц код ИНН не проходит валидацию по контрольному числу и, соответственно, такие коды отсутствуют в ЕГРЮЛ.
Примеры:
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=fb57994f-8f17-4d9b-a492-41cff6b912ef. ООО «Диамид». Код ИНН в РНП: 6668180882, настоящий код ИНН 6658180882
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=54d8abde-b49e-491d-a01b-fae2e9305d4c. ООО «Нагель», Код ИНН в РНП: 7726526721 не проходит валидацию

Всего таких 26 случаев.

3. Есть ряд случаев когда в наименовании юридического лица используются латинские символы, причём необоснованы.
Например:
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=93a3b3dd-93bd-4d58-8858-94c2321a446f. Организация ООО «Символ». Вместо русской буквы «эс» используется английская «цэ». Практически это то же самое что латиница в госзакупках.
Для организаций:
http://rnp.fas.gov.ru/RNPCard.aspx?id=a3006b56-1e50-498b-a289-f351641bbb3c, http://rnp.fas.gov.ru/RNPCard.aspx?id=035d9a4d-3346-4d1b-8228-3fe2b3732026, http://rnp.fas.gov.ru/RNPCard.aspx?id=d1738a37-4e12-48bd-895a-81f9fcc0969e и
http://rnp.fas.gov.ru/RNPCard.aspx?id=7799eb7e-68bf-4bb9-a513-d9773ed3e9d5
английские буквы «o» используются в части названия «OOO»

Всего таких 5 случаев.

4. Есть множество примеров в реестре когда вместо ИНН организаций или ИП неполон или избыточен. Например, есть один случай с организацией с ИНН в 9 символов http://rnp.fas.gov.ru/RNPCard.aspx?id=073c5990-b06b-460b-8e54-46f3f03c2bcd и
31 случай с организациями и ИП с ИНН в 11 символов (чего в природе не бывает).
Вот пара примеров:
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=17ad2a22-d9ba-40e6-821c-a3a8b135c2cf
-
http://rnp.fas.gov.ru/RNPCard.aspx?id=750aee23-1022-42e2-b7f7-a349ed43728c

Итого более 70 только наиболее очевидных случаев когда проверка организации в реестре недобросовестных не сработает.
А также я могу проверить не заключались ли с данными организациями контракты _после_ их внесения в реестре. Если окажется что заключались, то тут будет ситуация где имеется экономический ущерб.

И, конечно, это не глубокий анализ. Например, я не проверял случаи у одной организации может быть указан корректный ИНН другой организации. Или же опечатки в русских названиях организаций. Или же соответствие этих названий названиям организаций в ЕГРЮЛ, поскольку в реестре недобросовестных сейчас всё вперемешку. Где то используются полные названия организаций, а где-то краткие. Что, вообще-то, неверно. Поскольку поставщик может подаваться под любым из этих названий.

Выводы, я думаю, тоже очевидны – недостаточный контроль ФАС России за реестром в результате чего в нём присутствует недостоверная информация.
————–

Originally published at Иван Бегтин. You can comment here or there.

Новое в OpenGovData.ru &#8211; данные, заметки, источники и примеры
29 августа 10 12:23

Итак, в OpenGovData.ru и его Вики появилось много нового.

1. За 4 дня было было создано 14 парсеров и, соответственно, у нас появилось 14 новых массивов машиночитаемых данных. Почти все были сделаны волонтёрами по своей инициативе. Я считаю что это очень круто и мы вместе делаем очень важное дело. Пусть и по маленьким кусочкам, но, свершилось главное идея создания машиночитаемых данных своими руками – работает.

Кстати, предлагаю всем подумать над тем как можно проанализировать и что можно из этих данных интересное сделать. Например, я лично уже копаюсь в реестре недобросовестных поставщиков, а кому могут быть интересны данные государственного регистра фильмов, базы запуска космических аппаратов или сводной налоговой отчетности. Предлагаю всем заглянуть в то что у нас уже есть тут в вики и в списках массивов данных.

2. В список источников opengovdata.ru я добавил ещё 10 новых. Их можно просмотреть в списке тут в основном это статистика ФСИН, МЧС и МВД. Присылайте новые мне или вносите в список в вики проекта тут

3. В разделе рецепты и инструменты добавились ссылки на примеры кода, фреймворки и движки по извлечению данных, их обработке и визуализации. Постепенно там будет собрана максимально обширная коллекция материалов. Если Вы видите что там чего-то нехватает, смело добавляйте или пишите мне – я добавлю.

4. Я начал вносить в Вики собственные парсеры накопленные мною за время работы над opengovdata.ru. Сейчас на странице со списком преобразованных данных я выложил парсер списка сайтов кредитных организаций (банков) с сайта Банка России.

А также вот тут http://gist.github.com/555510 можно посмотреть пример кода как автоматизировать извлечение очень простых таблиц с веб-страниц и примеры того как этот код помог в сборе данных о грантах для РосГосЗатрат.  Фактически всё что нужно для простых таблиц – это ссылка, кодировка страницы и код xpath, как правило, очень простой.

Тем временем, пока мы вместо наших госорганов делаем данные открытыми и публичными, норвежские чиновники вот тут http://data.norge.no/blogg/2010/08/en-klausulbuffet-av-vilkar/ обсуждают вопросы лицензирования открытых данных отдавая предпочтение лицензии Creative Commons. Страница неплохо переводится на русский через Google Translate или же, разъяснения на английском, есть на общеевропейском портале.

Originally published at Иван Бегтин. You can comment here or there.

Вопросы и обсуждения по открытым данным
27 августа 10 12:46

Поскольку число обсуждающих всё ширится, я хочу поднять ряд вопросов которые возникли, озвучить своё мнение и предложить их к обсуждению.

1. Почему не Java, .NET и прочие и прочие?

В основном по той причине что есть ряд языков/платформ разработки крепко привязанных к компаниям их продвигающих. Так .NET прочно ассоциируется с Microsoft, а Java с Sun/Oracle. Учитывая что эти платформы в основном коммерческие то и, хотя разработчиков на них много, но многие самые интересные движки и библиотеки которые могли бы помочь – тоже коммерческие.

Я лично считаю что для инициативы создания общественного блага на этих платформах должны идти от их вендоров или при их поддержке. Но учитывая что тема имеет гражданское приложение, я слабо верю в то что кто-то из них на это решиться.

В остальном здесь ситуация следующая. Если кто-то по собственной инициативе сделает парсер данных хоть на Lua или Object Pascal и выложит его в открытый доступ, ему в любом случае, респект и уважуха и такие случаи я упомяну обязательно. Но в том что касается случаев когда я выделяю на перевод массива в машиночитаемый вид денежку, то тут точно нет. Моя цель – открытые данные и наиболее простые и понятные способы их создания.

2. Не упомянут Perl

Это правда, но не от нелюбви к нему, а по невнимательности. Конечно, на скрипты на Perl’е всегда приветствуются.

3. Почему не GPL?

Тут та же самая ситуация что и с вендорозависимыми платформами. Если кто-то по своей инициативе хочет сделать скрипт по перобразованию данных и выложить его в открытый доступ под GPL. Хорошо, в любом случае общественное благо. Но лично я рассматриваю лицензию GPL как ограничивающую возможности, а не расширяющие. Соответственно в тех случаях когда я публикую предложения преобразовать за деньги которые я выделяю лично – на GPL это не распространяется. Если же кто-то последует моему примеру и решится выделить средства или вообще организовать такую же инициативу, но GPL’ориентированную – организуйте её самостоятельно. Это тоже общественное благо, тоже респект и уважуха.

4. Почему не RDF и не Semantic Web?

Для спрашивающих, я в общем-то человек сам от Semantic Web’а не далеко ушедший и, например, моделировал геополитическую онтологию в формате OWL о чём можно узнать в моём блоге или в вики OpenGovData.ru.

Так вот, RDF’изация вселенной разумна и практична только когда у Вас _уже_ есть структурированные данные или если Вы формируете онтологии своими руками. Соответственно если у кого то возникнет желание и возможность переводить данные накопленные в OpenGovData.ru и уже преобразованные в форматы для Semantic Web – милости прошу. Лично я же считаю, и сужу по мировому опыту гражданских проектов, что для них достаточно принципиальное наличие данных в структурированной форме, желательно простой – CSV или JSON. Поэтому и все существующие проекты, например, Open Knowledge Foundation помимо RDF отдают данные ещё и в XML и JSON’е. Потому как пока ещё, к сожалению или к счастью, но RDF не стал массовым явлением.

Originally published at Иван Бегтин. You can comment here or there.

Про реестр недобросовестных поставщиков и ФАС России.
26 августа 10 03:02

Итак, по поводу вот этой темы с ошибками в реестре недробросовестных.

Я отправил письмо в ФАС России, там его получили, отнеслись к написанному серьёзно, обещали в течении недели разобраться.

Раз такое дело, я планирую несколько дней подождать их ответа. Если его не будет, размещу найденное, а потом уже их ответ как придёт, если ответ будет то размещу вместе найденные проблемы и их реакцию.

В зависимости от их ответа будет понятно надо связываться с другими контрольными органами или нет.

А тем временем, каждый из Вас может и сам заглянуть в данные этого реестра тут – http://github.com/kappa/opengovdata-parsers или тут http://github.com/AmbientLighter/rpn-fas (спасибо Алексею Капранову и Сергею Мирееву за парсеры!) и поискать там интересное для себя.

Зачем всё это нужно? Это будет ничто иное как кейс использования открытых данных для контроля граждан за органами власти. Наглядная демонстрация того для чего это всё делается.

Originally published at Иван Бегтин. You can comment here or there.

OpenGovData.ru: Данные для преобразования на неделю с 26.08.2010 по 02.09.2010
26 августа 10 10:31

Итак, как я ранее уже писал начнём процесс по преобразованию данных.

План работы такой:

1. Я еженедельно публикую список массивов данных и призываю волнотёров помочь с их преобразованием.

2. В конце недели я публикую отчет по результатам и публикую новый список.

3. Если какие-то данные небыли охвачены волонтёрами, то на следующей неделе публикую их с предложением компенсировать расходы на их преобразование.

4. Самые сложные массивы данных выносятся на общее обсуждение.

Актуальный список также всегда будет доступен по ссылке и я буду его обновлять по мере появления парсеров.

Ниже список данных составленный мною на эту неделю с 26 августа по 2 сентября. Я также собираю предложения по тому какие данные вынести на следующую неделю.

Источник данных в плохом формате Для чего могут быть использованы эти данные Статус Парсеры и данные
Технические комитеты Ростехрегулирования</p>

http://www.gost.ru/wps/portal/pages.TechCom

Список и множество HTML страниц

Для мониторинга того чем занимаются комитеты, если у них сайты, какие из них были бы интересны гражданам и так далее Не преобразован ?
Список зарегистрированных политических партий (Минюст)

http://www.minjust.ru/ru/activity/nko/partii/

Набор HTML страниц со ссылками на документы

Для последующего анализа списков региональных отделений, числа членов, финансовых отчетов и так далее. Не преобразован ?
Перечень зарегистрированных политических партий (Избирком)

http://www.cikrf.ru/newsite/politparty/reg_politparty.jsp

Очень простой и небольшой список партий с регистрационными номерами в избиркоме

Для сведения воедино всей информации о политических партиях из разных источников. Не преобразован ?
Государтсвенный реестр фильмов

http://mkrf.ru/activity/register/search/

Форма поиска. Особенность в том что для некоторых фильмов выводит страницу с подтверждением на её просмотр

Для анализа данных реестра на предмет наличия порнографии, оскорбительного содержания, анализа плодовитости авторов и компаний и многое другое Не преобразован ?
База запусков космических аппаратов

http://www.federalspace.ru/main.php?id=10&year=14
Набор HTML страниц по годам

Позволит провести анализ запущенных аппаратов по изготовителям, заказчикам, странам, потенциальным местам падения, составить календарь истечения сроков эксплуатации и использоваться для более наглядного отображения. Не преобразован ?
Депутаты Государственной Думы

http://www.duma.gov.ru/index.jsp?t=deputat/1.html

Много отдельных маленьких страничек

Позволит делать гражданские проекты основанные на активности депутатов. Например, по мониторингу их выступлений, публикаций в блогах с фильтрацией по партии, фракции, комитету госдумы и так далее Не преобразован ?
Российский сегмент мирового пространства идентификаторов объектов

http://www.ctel.msk.ru/x500/OIDS/inform.htm
Одна HTML страница с несколькими таблицами

Например, для наглядного соотнесения удостоверяющего центра и органа власти дабы показать в каких из них уже есть свои УЦ, а где нет. Не преобразован ?
Реестр эксплуатантов гражданской авиации

http://www.favt.ru/airl/airl_r/index.php
Несколько HTML страничек с алфавитной разбивкой

Для отображения организаций на карте, соотнесения с другими банками данных для анализа отрасли авиаперевозок, для анализа какие эксплуатанты к каким аэропортам относятся Не преобразован ?
Государственный реестр аэропортов гражданской авиации

http://www.favt.ru/ap/ap_rga/

Одна HTML страница с несколькими простыми таблицами

Позволяет отобразить официальный список существующих аэропортов на карте, а также расширять этот список адресами сайтов и реквизитами предприятий. Не преобразован ?
Сведения о доходах сотрудников РосГраницы
http://www.rosgranitsa.ru/about/income

В виде множества DOC файлов с таблицами внутри

Для сервисов по анализу данных о расходах чиновников Не преобразован ?
Сводная налоговая отчетность
http://www.nalog.ru/document.php?id=27443&topic=stat_otch

Сложные данные в виде множества XLS файлов.

Для анализа того как и по каким темам приходят деньги от налогоплательщиков. Не преобразован ?

Поскольку массивы данных вроде сведений о доходах сотрудников Росграницы и Сводную отчетность никто не преобразовал. То если кто-то возьмётся за них, я готов подарить за скрипт, который как и все другие скрипты будет потом в публичном доступе, по любому из них по 1000 рублей. Не скрою, мой интерес не только в том чтобы появились эти данные машиночитаемыми, но и в том чтобы появились примеры преобразований данных в форматах DOC и XLS, ибо их у нас публикуется немало.

Единственно, предупредите меня заранее что берётесь такой скрипт написать дабы не дублировать усилия.  А если по каким-то причинам не хотите делать их за деньги, тоже, пожалуйста, об этом напишите мне.

Originally published at Иван Бегтин. You can comment here or there.

Любите ли Вы Антимонопольную Службу так как люблю её я?
26 августа 10 01:18

Итак, всем кто задавался вопросом зачем нужны некоторые массивы данных и какой с них толк, я собираюсь показать один живой наглядный пример.

Как Вы знаете один из интересных массивов был Реестр недобросовестных поставщиков http://rnp.fas.gov.ru/ ведомый Федеральной Антимонопольной Службой нашей с вами Федерации.

В этот реестр вносятся поставщики которые не имеют право участвовать в госзаказах и госзаказчики, по хорошему, должны проверять нет ли там заявляющихся на госторги организаций.

Казалось бы, а нафига он нужен машиночитаемый? И кому?

Так вот. Подозрения у меня были довольно давно, но всё небыло возможности подойти к вопросу системно. Сейчас же я _могу доказать_ что в этом реестре есть недостоверная информация наличие которой не  позволит, для некоторых организаций, убедиться был включён ли поставщик в реестр недобросовестных.

Прямо перед глазами у меня 30 наиболее очевидных случаев и это ещё результат неглубокой проверки, а глубокая проверка может выявить большее число. Случаи на грани очевидности, при желании их найти могу не только я. И да, это не устаревшая информация которая стала недостоверной по истечении времени. Это информация не соответствующая действительности изначально при её внесении.

Я не берусь судить как такое могло произойти – опечатками, из-за недостаточности контроля, сознательно и т.д.  Возможно так данные передавались от госзаказчиков, возможно. Не знаю. Я оперирую только фактами, наличием таких вот случаев.

Итак, а теперь главный вопрос, что с этим делать.

Варианты следующие:

1. Разместить очевидные примеры онлайн для всех желающих – пусть блоггеры обсуждают, СМИ пишут.

2. Написать в ФАС РФ, на тему не хотят ли они исправить выявленное и вообще отрегулировать ведение этого реестра. А публиковать онлайн только после того как будет известна их реакция.

3. Провести более детальный анализ, он займёт с неделю, и передать материалы в другие контролирующие органы (Прокуратура, СП РФ, Контрольное управление и т.д.) или передать материалы тем кто передаст.

4. Передать какому-нибудь СМИ на публикацию. Если конечно, тема будет интересная для СМИ.

В общем я не решил пока, думаю. Беру паузу в сутки и потом напишу что да как.

Originally published at Иван Бегтин. You can comment here or there.

Ещё не конкурс, но обсуждение!
25 августа 10 10:35

В ВебПланете вышла статья про то что я уже организовал конкурс – http://www.webplanet.ru/news/service/2010/08/25/begtin.html.

Друзья, спасибо за привлечение внимания к идее. Только это ещё не конкурс, это был анонс обсуждения и сбор предложений как конкурс организовать. Обратите, внимание, на разницу.

Результаты обсуждения уже доступны тут http://ivan.begtin.name/2010/08/25/idearesults/

И конкурс будет проходить по описанной там схеме:

1. Я еженедельно буду публиковать список из 10 массивов в «плохих форматах» с предложением волонтёрам их преобразовать.  К волонтёрам просьба – если возьметесь за работу, отпишите мне – чтобы я соответственно отметил этот массив и укажите если Вы берётесь за это бесплатно.

2. В течении недели, если кто-то за преобразование берётся, я отмечаю в Wiki проекта что этими данными занимаются и потом там же публикую результаты – скрипт и массив данных.

3. В конце недели публикуют отчет с итогами. Какие данные преобразованы, а какие нет и следующий список из 10 массивов.

4. Если какие-то данные небыли преобразованы в течении недели. Например, были волонтёрами неинтересны или же массивы сложности, я публикую все непреобразованные данные списком с указанием суммы которую я готов подарить за их преобразование.

5. В случаях сложных и больших массивов данных каждый из них будет выносится на широкое обсуждение.

Если редактора ВебПланеты читают мой блог, поправьте, пожалуйста, у себя в статье.

Тем временем уже за короткий срок уже появилось 7 машиночитаемых массивов данных . Это очень круто, я не ожидал такого результата, если честно.

Originally published at Иван Бегтин. You can comment here or there.

Результаты обсуждений идеи
25 августа 10 03:00

Итак, по идее которую я ранее озвучил тут что я хочу инициировать процесс по созданию открытых машиночитаемых данных усилиями сообщества появились первые результаты.

Во первых пошли обсуждений сразу в нескольких местах: здесь - http://ivan.begtin.name/2010/08/24/opendataidea/ , здесь – http://ivbeg.livejournal.com/313161.html и здесь http://groups.google.com/group/opengovdataru/browse_thread/thread/5ef181f1c9e19c72 и тут http://ff.im/pE9Ww. Что мне особенно нравится обсуждение идёт конструктивное – за что спасибо всем участникам.

Во вторых, стоило мне объявить о том что я собираюсь такой конкурс сделать, даже до его объявления мне уже прислали несколько скриптов и массивов данных преобразованных массивов.  Я собрал их все на странице Wiki под названием «Как помочь проекту«. Отдельное спасибо Артемию Трегубенко (arty.name) и Сергею Кожину (http://github.com/skojin) за эти скрипты. А Алекс Капранов взялся за реестр недобросовестных поставщиков. Во всех случаях если не указано иное авторами, я буду размещать такие скрипты и данные под лицензиями PDDL (Public Domain Data License) и Creative Commons Attribution 3.0 Unported License. Да, никто из авторов не спросил денег за работу, но если всё таки  сочтёте что она денег стоит – пишите сразу мне.

В третьих не единожды мне уже написали о том что надо мотивировать не деньгами, а общественным благом. То есть надо описывать ту пользу которую мы создаём преобразуя эти данные. Тут есть не проблема, но вопрос понимания. Сложно доказать прямую пользу от открытых данных поскольку польза не прямая, а на основе производных от них проектов – таких как OpenCongress.org, да и РосГосЗатраты весь и целиком основан на открытых данных как и другие проекты. Создавая открытые данные мы меняем реальность поскольку далее на их основе может быть создано нечто новое, интересное и полезное и далеко не всегда можно предсказать что именно.

В четвёртых я услышал гениальное предложение что надо предлагать компаниям нанимающим программистов предлагать написание парсеров в качестве тестового задания. Если Вы ищите программистов и даёте им тестовые задания, обращайтесь ко мне – я Вам предоставлю список никем пока ещё не преобразованных данных для которых парсеры нужны. Если потом ещё и результаты будут в открытом доступе под Creative Commons – так вообще прекрасно. Точно также, если Вы обучаете студентов, даёте им тестовые задания – я готов, по мере возможностей, помочь с тем какими эти задания могли бы быть. По написанию парсеров, очистке данных, их преобразованию и так далее. Здесь все задачи живые, результаты будут общедоступные, общественное благо будет несомненным.

В пятых, я отвечу на ряд возникших вопросов.

1. Почему только скриптовые языки?

Потому как в большинстве случаев с ними проще управляться, легче использовать в веб-проектах и так далее. Я лично ничего не имею против различных вендоро-специфичных платформ/языков вроде .NET и Java, но не вижу смысла без поддержки самих вендоров на этих платформах.

2. Откуда требования к выходным форматам?

На основе мирового опыта, удобства для пользователей и так далее. Например, данные в CSV сравнительно просто загрузить в MS Excel, OpenOffice или, даже, в GridWorks. XML данные также легко преобразуются и есть много инструментов для работы с ними. JSON очень удобен при веб-разработке и загрузке в NoSQL базы вроде MongoDB.  Плюс, конечно, ещё есть KML формат для геоданных, но я лично считаю его производным от других. То есть вначале хорошо бы получить данные в CSV, а преобразовывать их это уже следующая задача.

3.  Почему среди лицензий нет GPL?

Потому как, GPL, несмотря на все свои плюсы и распространённость довольно жёсткая лицензия. Я считаю что автор должен иметь возможность использовать этот код и для коммерческих целей, равно как и все остальные.

4. Как быть с описанием структур?

По хорошему, прежде чем преобразовывать плохие форматы в хорошие надо бы их описать в некой структурированной форме, например, XSD. на практике, лично я считаю, что этого можно избежать в некоторых случаях когда структура, условно, очевидна. То есть, если мы понимаем что все данные представлены в виде одной плоской таблицы, то последующую структуризацию можно провести постфактум. В случае сложных данных, согласен, имеет смысл моделировать ситуацию, до.

5. Зачем всё это нужно?

Основная цель – создать фундамент для последующих гражданских проектов поскольку сейчас мы находимся, в некотором смысле, тупиковой ситуации. Когда государство не раскрывает данные поскольку исходит из того что они никому не нужны и «общество не готово», а гражданские проекты не появляются поскольку данных нет. Сейчас мы готовим набор ингридиентов на основе которых потом каждый сможет творить собственные блюда.  И чем больше ингридиентов появится, тем больше шансов что будет больше гражданских проектов на их основе.

6. Можно ли эти данные использовать в своих проектах?

Да, несомненно можно и нужно. Как для некоммерческих так и для коммерческих проектов. Для некоммерческих проектов я думаю что и так понятно почему. Для коммерческих это нужно для формирования рынка сервисов основанных именно на открытости данных, а не на доступе к ним на эксклюзивной основе. В мире такие сервисы, в основном, сосредоточены на визуализации данных, подмешиванию их в результаты поисковой выдачи, алгоритмах по работе с информацией, проектов вроде InfoChimps и Factual предоставляющие удобные инструменты для работы с информацией.

——-

И в пятых. По результатам обсуждения я хочу немного трансформировать эту идею. Я вижу что на сравнительно простые массивы данных энтузиасты находятся и их преобразуют. Со сложными случаями, когда данные публикуются в форматах Excel’я, Word’а или PDF.  Или же когда используются сложные формы за которыми данные скрыты. Или же когда структура HTML неудобна для обработки.

Я предлагаю следующее. Я готов размещать в Wiki проекта, на сайте OpenGovData.ru и других ресурсах, на которых только дотянусь, статьи касающиеся преобразования данных различными инструментами. Особенно меня интересуют сложные случаи и статьи с примерами на основе данных OpenGovData.ru. Все статьи будут публиковаться с указанием автора под Creative Commons лицензией.

Соответственно, статья – это всё таки несколько большая работа чем просто преобразовать данные и я готов за такие статьи платить денежку. За обычную статью – 1000 рублей, за статью на особо интересные темы – 2000 рублей. С общим бюджетом в 10 тысяч рублей на месяц и оплатой через Яндекс.Деньги. А если кто-то готов написать, без денег – также милости прошу. Просто отметьтесь, скажите что готовы сделать это без денег.

Какие темы хотелось бы охватить: преобразование данных стандартными скриптовыми языками вроде Python, Ruby, PHP и так далее, обработка данных в общем случае, обзор форматов данных и другие связанные темы.

Темы которые особенно интересны лично мне:

- автоматическое извлечение данных из документов Word, Excel, PDF,

- сбор данных с веб-страниц закрытых за POSTBACK навигацией которая используется в сайтах на asp.net

- трюки, хитрости, сложные случаи

- обработка и очистка данных, в том числе автоматическая. например, интересен обзор работы с Freebase Gridworks;

- как визуализировать данные – строить графики на разных движках. Желательно opensource, но пойдут и другие

Если какие-то темы тут не упомянуты, но Вы считаете что они важны, прошу Вас, предлагайте.

С каждой статьей, соответственно, нужен пример открытых данных из OpenGovData.ru или какой-либо другой пример госданных который там не упомянут (заодно его туда добавим).

Соответственно если Вы захотите такую статью написать – пишите мне на ibegtin (собака) gmail.com или комментарием. Мне нужны тема и то какой массив данных вы в статье используете как пример.

А по преобразованию данных данных я предлагаю следующую схему.

1. Я еженедельно буду публиковать список из 10 массивов в «плохих форматах» с предложением волонтёрам их преобразовать.  К волонтёрам просьба – если возьметесь за работу, отпишите мне – чтобы я соответственно отметил этот массив и укажите если Вы берётесь за это бесплатно.

2. В течении недели, если кто-то за преобразование берётся, я отмечаю в Wiki проекта что этими данными занимаются и потом там же публикую результаты – скрипт и массив данных.

3. В конце недели публикуют отчет с итогами. Какие данные преобразованы, а какие нет и следующий список из 10 массивов.

4. Если какие-то данные небыли преобразованы в течении недели. Например, были волонтёрами неинтересны или же массивы сложности, я публикую все непреобразованные данные списком с указанием суммы которую я готов подарить за его преобразование.

5. В случаях сложных и больших массивов данных каждый из них будет выносится на широкое обсуждение.

Комментарии и живое обсуждение всячески приветствуется.

Originally published at Иван Бегтин. You can comment here or there.

Проверка идеи по созданию открытых данных общественными силами
24 августа 10 09:01

Есть одна идея которую лично я считаю что просто необходимо подтвердить или опровергнуть экспериментально.

Эта идея проста – не обязательно дожидаться когда госорганы начнут публиковать данные в машиночитаемом виде, многие массивы можно подготовить и опубликовать самостоятельно. Благо существует разнообразный инструментарий для создания парсеров.

При том что с волонтёрской деятельностью у нас, пока, прямо скажем – не очень. Поскольку если много других полезных занятий, а открытые данные пока ещё «проникают в умы людей», но не поселились там.

То о чём я пишу пока идея для обсуждения, которая, впрочем может стремительно воплотиться в жизнь.

Что я хочу сделать.

В качестве эксперимента я готов выделить из личных средств 5-10 тысяч рублей на 1 месяц на разработку парсеров. Сумма небольшая, но это именно что эксперимент, это проверка идеи.  А если всё получится, то суммы потом будут больше.

Однако я хочу не просто заказать работы  на стороне, а с соблюсти следующие условия:

1. Код парсера должен быть доступен всем желающим с открытым исходным кодом под лицензией допускающей коммерческое и некоммерческое использование. Предпочтительные лицензии – BSD, MPL, Apache License и т.д. Соответственно без проприетарного кода и без GPL. Код автор публикует в сети сам или присылает мне и я публикую на специальном сайте или OpenGovData.ru

2. Предпочтительные языки разработки по убыванию – Python, Ruby, PHP. Другие скриптовые возможны, но менее предпочтительны. Языки предусматривающие компиляцию кода вроде C, C++, Java  точно не рассматриваются.

3. Форматы выходных данных могут быть – CSV, XML, JSON. Соответственно CSV предпочтителен для всех плоских списков, для более сложных структур нужны данные в XML и JSON.

4. Код не должен подвергаться обфускации. А то есть он должен быть читаем, понимаем и, с возможностью, его править, при необходимости.

А также обработать надо не какой-попало источник данных, а один из некого первоочередного списка.  Этот список, предварительно, я составил из следующих массивов:

Простые массивы

Сложные массивы

  • Сведения о доходах сотрудников РосГраницы – http://www.rosgranitsa.ru/about/income . Несколько .DOC документов с таблицами.
  • Реестр недобросовестных поставщиков – http://rnp.fas.gov.ru/
  • Реестр лицензий на осуществление деятельности по организации и проведению азартных игр в букмекерских конторах – http://www.nalog.ru/html/docs/reestr_buk.doc . Файл MS Word со сложными, но унифицированными таблицами.
  • Сводная налоговая отчетность – http://www.nalog.ru/document.php?id=27443&topic=stat_otch. Очень много многостраничных XLS файлов.

Плюс, прошу Вас предлагать те что Вам интересны. Список можно найти тут – http://www.opengovdata.ru/sources/

В итоге для каждого массива должно быть:

– скрипт по его конвертации;

- данные в машиночитаемом формате

– короткое описание README с описанием зависимостей скрипта и полей данных

И вот тут, то мы приходим к главному вопросу КАК именно это всё это я хочу осуществить.

Вначале – мои цели:

1. Преобразовать как можно большее число массивов в машиночитаемый вид.

2. Обеспечить преобразованию максимальную публичность и простоту повторного использования результатов через открытый код.

3. Преобразовать в первую очередь наиболее востребованную гражданами информацию.
И вот теперь собственно мои вопросы по результатам размышлений о вышенаписанном.  Меня волнует следующее – в какой форме лучше всего организовать процесс.

Рассмотрим варианты:

  • Призовой конкурс. Для каждого массива данных устанавливается сумма за его преобразование в машиночитаемый вид. Первый кто прислал или опубликовал результат – получает эту сумму. Если больше одного человека пишут скрипт – второму идёт поощрительная сумма.
  • Редукцион. Указывается максимальная цена, сроки и ожидаемые результаты, от потенциальных исполнителей получаются предложения сделать за меньшие или эти деньги. Побеждает тот предлагает наименьшую цену. Но у нас же не госзаказ, нам нужна соревновательность.

При этом меня не покидает ощущение что есть и другие варианты. Или же эти варианты стоит описать чуть подробнее. В любом случае совершенно не хочется запускать процесс через заказы на Фриланс.Ру, по моему можно найти удачную альтернативу.

—-

Поэтому у меня есть следующие вопросы залу:

1. В какой форме лучше всего организовать процесс?

2. Какие существующие массивы данных Вам бы _очень_ хотелось увидеть машиночитаемыми и включить в список выше?

3. Если Вы разработчик, было бы Вам интересно в таком мероприятии поучаствовать?

Идеи, предложения, дискуссии и распространение всячески приветствуются.

Originally published at Иван Бегтин. You can comment here or there.

Ссылки на 23.08.2010: Интересные статьи и материалы
23 августа 10 05:54
  • В журнале Коммерсант-Деньги статья Запретный лот сладок про то как отбирали площадки для электронных аукционов. Там есть и мои комментарии по этой же теме. Вообще же я считаю что правительство отнеслось к выбору площадок (а вернее юр. лиц создающих эти площадки) весьма неаккуратно.
  • На сайте Demoscope.ru статья Жара и смертность с анализом проишествий аналогичных августовской жаре в Москве и их последствий на людей. Опубликованный мною график вставили и упоминания «блоггера Ивана Бегтина» там тоже есть, но ссылки решили не давать. Ну да ладно, будем считать что данные общественным благом.
  • В блоге tri_botinka две замечательные ссылки про события 6-летней давности – http://ailev.livejournal.com/2004/01/13/ и http://ailev.livejournal.com/2004/01/21/ о том как Анатолий Левенчук общался с представителями Минсвязи. Будьте уверены что за последние годы мало что изменилось, не только применительно к Минсвязи, но и ко многим другим ведомствам.
  • Ведомости пишут про ФКС – http://www.vedomosti.ru/newspaper/article/243865/ministerstvo_goszakaza. Не  буду комментировать, будущее ФКС определяют не мои комментарии, а исключительно воля Правительства к систематизации госзаказа.
  • Газета.Ру пишет что «ФАС хочет ввести госпошлину на жалобы«. Это совсем не тот случай когда «слов нет», вовсе наоборот, слов очень много на языке вертится. И я согласен с Альбертом Бертяковым что после 3-х таких инициатив, хорошо бы, инициатора предупреждать о неполном служебном соответствии. Хотя и понятно откуда у представителей ФАС такие идейки – с 1 января заработает единый портал по госзакупкам – в разы больше закупок, в разы больше публичность ну и поток жалоб тоже, того, в разы больше.

Originally published at Иван Бегтин. You can comment here or there.

Онтология центральных органов власти
21 августа 10 11:54

Возвращаясь к моим рассуждениям об онтологиях АТД и онтологиях структуры органов власти рассмотрим, например, онтологию центральных органов власти.

О том как её можно промоделировать, уровнях сложности и так далее.

Для начала необходимо определить какие именно органы власти считать центральными и что в эту онтологию должно входить. Как я вижу главное и необходимое – в онтологию должны быть включены все организационные сущности упоминаемые в Конституции, такие как Президент, Правительство, Федеральное собрание, Счетная Палата, Генеральная прокуратура, Высшие органы судебной власти, Центральная избирательная комиссия. А также ряд органов имеющих федеральное значение – таких как как Совет Федерации. Возможно сюда же необходимо включить уполномоченных по правам человека и по правам детей.

Далее, как именно осуществлять моделирование. Ключевые вопросы здесь – это выстраивание иерархии и детальность описания.

Есть несколько подходов.

1. Подход простой

Моделирование производится по минимуму. Для каждого органа власти есть следующая информация:

- полное наименование

- краткое наименование

- официальный адрес

- официальный сайт

- контактный(-е) телефон(-ы)

- ФИО руководителя

- Полное наименование должности руководителя

- ссылка на вышестоящую структуру

- принадлежность к структуре

При этом такие органы власти как Администрация Президента и Правительство описываются включая организации входящие в их структуру – Министерства, Федеральные агентства и службы.

Но подробного описания по структурам каждого из органов власти не формируется, а то есть не производится детализация департаментов, территориальных подразделений и так далее.

Минусы подхода.  Мы теряем множество связей не характеризующихся подчинённостью или вхождением органа власти в другой. Например, Счетная Палата хотя и образуется Советом Федерации и Государственной думой, нельзя однозначно сказать что подчиняется этим структурам. То же самое нельзя сказать с Генеральной Прокуратурой. Формально, в Конституции у нас прокуратура – это единая структура, а влияние Федерального Собрания распространяется только на избрание генерального прокурора.

Также, при таком подходе нет описания подробностей того чем занимаются отдельные органы власти.

При таком подходе, также, необязательно предварительное моделирование Конституционной онтологии, поскольку ссылки с описания госструктур на понятия закреплённые в конституционной онтологии необязательны.

Соответственно, это ограниченный подход, с акцентом на утилитарность использования.

2. Подход детальный

Если же, всё таки, подойти к моделированию значительно более обстоятельно, то, в дополнение к данным выше, в описание госструктуры должно входить гораздо больше информации.

Кроме того в зависимости от типа госструктуры эта информация будет разной. А также в модели должны быть учтены совещательные и иные структуры не являющиеся органами власти.

Например, расширенная структура описания органа власти:

- название ведомства на английском языке;

- код ОКОГУ;

- код ГРБС, в случае если ведомство является ГРБС;

- ссылка на понятие в Конституционной онтологии, если там оно упоминается

- дата принятия указа о создании данного органа власти

- документ, определяющий факт создания органа власти – приказ, распоряжение, конституция

- реквизиты документа положения о данном органе власти: дата принятия, номер документа, ссылка на тип документа нормативно-правовой онтологии

- структурное описание положения о ведомстве включая:

– описание ведомства

– подведомственность другому органу власти

– перечень уровней власти и других органов с которыми данное ведомство взаимодействует (ссылками на объекты)

– список задач ведомства

– список функций ведомства

– список полномочий ведомства

- реквизиты юридического лица – ИНН, КПП, ОГРН, юридический адрес, если является юридическим лицом;

В случае Администрации Президента также описываются совещательные органы – Совет Безопасности, Государственный Совет, комиссии при президенте и советы при президенте включая следующую информацию:

- полное наименование совещательного органа;

- краткие сведения

- состав в формате: ФИО, Должность, статус в совете (комиссии)

- реквизиты и текст документа положения о совещательном органе включая: номер НПА, дата принятия НПА, текст НПА (структурный, с разбивкой по пунктам);

- основные задачи совещательного органа – каждая задача описывается отдельно со ссылкой на пункт положения;

- ссылка на сайт совещательного органа, если сайт есть

В случае правительства, помимо структуры правительства по органам власти, также необходимо описание структуры по ответственным вице-премьерам. Фактически это персонифицированная структура распределения обязанностей, которая, должна была бы выглядеть следующим образом:

- ФИО вице-премьера;

- полная должность;

- перечень курируемых вопросов;

- перечень курируемых органов власти;

- перечень курируемых нац. проектов, федеральных целевых программ

В случае правительства, также, подробное описание координационных и совещательных органов, в основном это правительственные комиссии, а также Морская коллегия.

Для каждого органа описание включает:

- полное наименование

- реквизиты и текст документа положения о совещательном органе включая: номер НПА, дата принятия НПА, текст НПА (структурный, с разбивкой по пунктам);

- описание задач совещательного органа – текст и структурный перечень со ссылкой на пункты положения;

- состав органа включая: ФИО участника, статус участника в комиссии, должность участника;

- ссылка на сайт совещательного органа, если сайт есть

Примечание: Вообще именно с правительственными комиссиями большая проблема с доступностью информации об их деятельности. Данные на сайте правительства публикуются очень неравномерно, у некоторых комиссий есть свои сайты, например, у Морской Коллегии сайт есть ( http://www.morskayakollegiya.ru/), а у большей части других совещательных органов нет и информация об их деятельности представлена на сайте правительства и на сайте того органа руководит которым председатель этой комиссии.

Плюс структурное описание необходимо для таких органов как:

- Государственная дума – описание персон, комиссий, комитетов, фракций, партий.

- Совет Федерации – описание персон, комиссий, комитетов

- Счетная Палата, Прокуратура, Избирательная комиссия и так далее.

Отдельная большая тема в том как именно моделировать оргструктуру ведомств и как описывать отдельных персон. По хорошему, список персон надо выносить отдельно, делать ли это общим списком или же по разным органам власти отдельными – вот в чём вопрос. То есть, например, отдельно описывать персоны в статусе «депутат» и отдельно в статусе «чиновник».

Но, собственно, самое важное. Получается всего очень много, разьве что чуть меньше чем онтологии АТД, но с гораздо большей сложностью и числом связей.

Чем дальше тем более я думаю что онтологии органов власти также надо дробить на более малые и независимые. Отдельно онтология правительства, онтология АП, онтология Фед. собрания и так далее.

Originally published at Иван Бегтин. You can comment here or there.

Оптимизация органов власти в штате Юта и открытые данные
20 августа 10 08:21

Как пример того как проходят мини-реформы по оптимизации государственного управления в США, приведу в пример комиссию по оптимизации в штате Юта. Их деятельность подробно описана у них на сайте http://performance.utah.gov/index.shtml

Ну а если забраться в детали то можно найти вот такой их отчет для губернатора http://performance.utah.gov/optimization/Optcom_Final_Report.pdf

В отчете можно найти один из наиболее интересных принципов на которых построена работа комиссии.

Data driven – The Advisory Commission will be guided by data as they review state
government activities. As such, the Commission’s review will be removed from emotional
considerations.
и вот такой текст
Data Driven Management: Corrections, Community and Culture, Juvenile Justice
Services, and Workforce Services are all implementing technology to provide better,
more accurate data that will assist in making better informed business decisions.
В принципе отчет не очень большой, всего 64 страницы, хорошо структурированный и включающий конкретные предложения по созданию системы сбалансированных показателей, использованию данных из коммерческих систем для улучшения процессов принятия решения и так далее.
Но главное, конечно, это ещё один наглядный пример того что открытые (доступные) данные могут помочь не только гражданам и бизнесу, но и являются инструментами позволяющими проводить оптимизацию деятельности государственных структур.

Originally published at Иван Бегтин. You can comment here or there.

А давайте как составим вместе список желаемых данных
19 августа 10 07:55

Я какое-то время назад писал про те данные которых нет в машиночитаемом виде, но очень бы хотелось увидеть.

Пришла пора составить более полный и всеобъемлющий список для чего в вики OpenGovData.ru появился специальный раздел «Желаемые данные» где я составил первый список данных которых нет в машиночитаемом виде или доступ к ним ограничен, но которые очень бы хотелось получать именно в машиночитаемой форме. На сайтах ответственных за них ведомств или на data.gov.ru, когда он появится.

Основная мысль – описывать не то что уже есть, а именно то что хочется, что необходимо для контроля за деятельностью государства в самых разных областях и та информация которая имеет общественное значение.

Предлагаю желающим добавлять свои пожелания в Вики или присылать мне комментариями.

В дальнейшем, есть идея сделать реестр идей как в http://data.gov.uk/ideas/list и туда импортировать список из WIki.

Originally published at Иван Бегтин. You can comment here or there.

Открытые данные в ресурсном государстве
17 августа 10 03:37

Я не так давно уже делал обзор про открытые данные и российскую специфику, сейчас, прочитав несколько книг Кордонского, подправив терминологию и вообще проникшись точностью описания вижу как все те же проблемы можно описать не просто «в реальности», а «как оно на самом деле» (о разнице между этими понятиями можно почитать тут).

Рыночная экономика и гражданское общество

Собственно, главная проблема открытых данных в России в том что потребность в них может быть обеспечена всего двумя факторами – наличием рыночной экономики и гражданского общества.

Рыночная экономика, особенно с высокой конкуренцией, обеспечивает среду когда предприниматели, коих множество, приходят к согласованной позиции или действиям направленным на открытие информации которая может помочь их бизнесу или же, если приведёт к контролю за бизнесом, то охватит всех, а не малые группы. Например, публичное раскрытие данных акционерными обществами актуально только в условиях рыночной экономики и частью рынка является. В некоторых странах, например, США – это раскрытие уже формализовано настолько что данные в системе SEC публикуются машиночитаемыми много лет. Точно также рынок заинтересован в открытости и доступности информации о техническом регулировании, нормативно-правовом регулировании, информации о госзаказах, официальной статистике и так далее. А то есть в информации наличие которой позволяет извлечь прибыль или сократить расходы. А также есть отдельный сегмент рынка – информационные компании чей бизнес основан на работе с информацией, накоплением баз данных и так далее. Типичными представителями такого рынка можно назвать компании-владельцы крупнейших поисковых систем Google, Yahoo и Microsoft, а также крупные СМИ формирующие свои банки данных, такие игроки cloud-сервисов как Amazon и многие другие.

Гражданское общество, в его полноценном понимании, а не в той форме как оно существует в России в первую очередь заинтересовано в наличии и доступности информации позволяющее контролировать государство и бизнес. Это может быть информация о государственных расходах, чрезвычайных происшествиях, изменении климата, экологической обстановке и так далее. Наличие этой информации в форме пригодной для последующей интерпретации позволяет институтам гражданского общества воздействовать на государство и бизнес максимально эффективно.

Несомненно, также, что, и у рынка, и у гражданского общества интересы могут как совпадать так и напрямую конфликтовать, например, в части данных об экологическом состоянии. Однако, чаще, наличие таких конфликтов и их публичность позволяют найти компромиссные решения.

И, конечно, есть данные которые не являются полезными, напрямую, но могут существенно помочь при работе с другой информацией. Это справочники, классификаторы, геоданные и тому подобная информация, сама по себе, не представляющая особого интереса

Какие бывают данные

При том что далее речь пойдёт о специфики открытых данных в ресурсном государстве, тем не менее приведённая далее классификация типов данных относится не только к России. Её можно применить, в принципе, к любой стране.

Итак, исходя из предполагаемого потребления информации,разделим данные на следующие типы:

  • Ресурсные данные. Это данные обладающие прямой коммерческой или административной ценностью.
  • Контрольные данные. Данные, наличие которых позволяет обеспечить/повысить влияние общества и контроль над органами власти и бизнесом.
  • Справочные и иные данные. Эти данные не обладают прямой коммерческой или контрольной ценностью, но позволяют сформировать каркас для всех остальных данных и создавать удобные информационные продукты.

Это не жёсткая типизация и, на практике, бывают пересечения когда данные могут быть использованы для контроля и быть ресурсными, и даже справочными одновременно. Но чаще, всё таки, деление есть и оно заметно.

Основной интерес, конечно, здесь представляют ресурсные и контрольные данные, поскольку их публичность или непубличность непосредственно влияют на возможности ведомств в вопросах административного торга. Публичность ресурсных данных не позволяет их монетизировать или конвертировать в другие блага, а публичность контрольных данные позволяет гражданам/СМИ/НКО (гражданскому обществу) влиять на госструктуры больше чем им бы этого хотелось.

Разумеется, большинство государственных структур не заинтересовано в их публичности и старается обеспечивать их доступность в пределах их минимальных обязательств.

Примеры

Чтобы понять как и что происходит рассмотрим несколько примеров в подробностях.

Например, данные  ЕГРЮЛ. Это единый справочних всех юридических лиц в Российской Федерации который ведётся налоговой службой. Это типичный пример, ресурсных данных потребность в которых есть у практически всех кто занимается бизнесом в нашей стране. Необходимо получать собственные выписки из ЕГРЮЛ, многие проверяют своих контрагентов, ведут бизнес разведку и так далее. Этот массив, несомненно, имеет значительную ценность, но благодаря тому что он «в реальности» и «на самом деле» уже четко регламентирован. А то есть, ФНС России совершенно официально предоставляет к нему доступ за большие деньги, фактически, узаконен рынок посредников в получении данной информации. Вероятность что она станет общедоступна, фактически стремится к нулю. Основной потребитель рынок, известны регламенты получения информации, стоимость получения не столь высока.

Другой пример, рассмотрим базу ГОСТов ведомую Ростехрегулированием. Здесь ситуация куда сложнее. У этой информации «в реальности» есть статус общедоступной, но меры предпринимаемые этим ведомством по ограничению к её повторному использованию беспрецедентны. Достаточно взглянуть на публикуемые в виде постраничных сканов документы на http://protect.gost.ru чтобы в этом убедится. Потому как «на самом деле» и в реальности тоже, существует ФГУП «Стандартинформ» http://nd.gostinfo.ru/ который данную информацию предоставляет на коммерческой основе. При том что эта информация, несомненно, ресурсная, однако голоса рынка неслышно – видно лишь активности гражданского общества в лице ИРСИ, о чём можно почитать у них на сайте http://www.svobodainfo.ru/ru/taxonomy/term/76. Как оно должно быть правильно? Я считаю что тот факт что продажа ГОСТов может быть узаконена – это не самая серьёзная проблема. Потому как, во первых, к сожалению, «голос рынка» по поводу их доступности не слышен, а во вторых при обеспечении прозрачности

Следующий пример – это общероссийские, региональные и отраслевые справочники. По идее, это справочная информация, её общедоступность обеспечивается в виде публикаций всех изменений в нормативно-правовых документов и пытливые умы могут сами составить эти справочники из документов, однако на практике, они нужны в машиночитаемой форме и необходима возможность их обновления. Однако, здесь тоже не всё просто. Большая часть отраслевых и региональных справочников, действительно, доступны без ограничений. Их немашиночитаемость, как правило, не от злого умысла, а от неорганизованности их ведения и сопровождения. А есть и приятные исключения в виде сайта Службы ведения общегородских классификаторов и справочников города Москвы (http://www.mosclassific.ru/) которые предоставляют городские справочники в машиночитаемой форме и Портала информационного взаимодействия Комитета информатизации и связи Санкт-Петербурга (http://portal.iac.spb.ru/) где все городские и часть общероссийских справочников, также, машиночитаемы в форматах DBF. Схожая ситуация со справочником номенклатуры Минэкономразвития который доступен в XLS, фактически, машиночитаем, с КЛАДРов, СОУН и многими другими. Основная проблема возникает со общероссийскими справочниками которые найти актуальные и машиночитаемые одновременно большая проблема.

Ещё один пример, общероссийская статистика собираемая и публикуемая Росстатом. Формально, «в реальности» – эти данные общедоступны на их сайте. Но у статистических данных есть та немаловажная особенность что ценность они приобретают когда есть возможность их анализа и сопоставления, а то есть для данных статистики машиночитаемость это нечто безусловно необходимое. Но, «на самом деле», статистические данные это ресурсные данные и их машиночитаемое раскрытие приведёт к формированию на их основе значительного информационного рынка, а также созданию и развитию уже существующих продуктов. Например, будь данные Росстата машиночитаемы априори, другим ведомствам не пришлось бы запрашивать его руководителей о их использовании, предприятия могли бы их использовать не покупая статистических справочников, а информационные и поисковые компании использовать их в своих продуктах. Яндекс или Рамблер могли бы подмешивать в свою выдачу, а научные и исследовательские учреждения свободно анализировать эти данные и представлять в своих работах.  Я думаю что и так понятно, что будь данные статистики Росстата машиночитаемы, то ведомство лишилось бы чуть ли не главного своего ресурса и, по этой причине, лично я считаю что без принципиальных решений правительства ситуация тут с места не сдвинется.

А также данные о госрасходах публикуемые Минфином в виде бюджетной росписи, Росказной и администрациями субъектов в виде реестров контрактов.  Это типовой пример контрольных данных. Да, они могут быть полезны рынку, но, в основном, это инструменты мониторинга и контроля общества за государством и тем куда оно тратит деньги налогоплательщиков. Ситуация здесь куда лучше чем могла бы быть. Большая часть этих данных, за редким исключением, близка к машиночитаемости. Другое дело что ситуация с гражданским обществом у нас, мягко скажем, не очень и доступность данных не означает наличие тех кто систематизированно с ними работает.  Впрочем, это же касается всех остальных контрольных данных. В основном эти данные используют СМИ для ажиотажа или компромата. Однако, на них, например, удалось запустить проект РосГосЗатраты.

Выводы и ответ на вопрос «Что делать»

Выводов из всей этой ситуации несколько.

Во первых появление data.gov.ru возможно и даже без жёсткого сопротивления органов власти в случае если данные которые там будут содержаться будут носить справочных характер. Такой информации у госорганов очень много, вопрос лишь в её систематизации и организации. И даже польза от этого будет, поскольку наличие этой справочной информации способно помочь в улучшении уже существующих проектов.

Во вторых доступ к контрольным данным – это вопрос не технический, а социально-политический поскольку публичность подобного рода информации – это чистой воды политика. Но, в ситуации неразвитой среды гражданского общества, эффект от усилий будет невелик поскольку главная ценность открытых данных в их повторном использовании. Если же они не используются то и инициатива развития не получит.

В третьих, рассчитывать на раскрытие ресурсных данных, без поддержки со стороны их потребителей и лоббирующих структур этих потребителей – бессмысленно, поскольку для граждан не являющихся основными пользователями этой информации, борьба за их открытость не более чем шоу.

Кстати, большинство систем PSI и каталогов открытых данных содержат именно справочную информацию. Оттого и их популярность не столь высока как хотелось бы. Поскольку в странах где такие инициативы идут, госчиновники тоже не сами себе враги и информацию позволяющую контролировать их работу стараются публиковать по минимуму.

Делать же надо всё тоже и сейчас, но когда вопрос касается данных позволяющих контролировать органы власти, такие как подробные и структурированные сводки о ЧС, результаты экомониторинга, принятия нормативно-правовых актов и так далее, то надо готовится к сопротивлению госорганов и предложению очень конкретных мер, самостоятельной разработке форматов и извлечению нужной информации из разных источников.

Originally published at Иван Бегтин. You can comment here or there.

Структура госуправления Великобритании в Linked Data
15 августа 10 02:43

Читаю обсуждения в группе uk-government-data-developers и, что самое интересное, многие из решаемых ими проблем и наших очень похожи. Например, они сталкиваются с вопросами публикации и ведения исторических данных о структуре органов власти поскольку для полноценного анализа нужны данные по всем изменениям в структуре департаментов, АТД и так далее.

И дискуссия как раз вокруг вопроса как такие данные предоставлять и надо ли, поскольку без комментариев к причинам изменений, интерпретация фактов у людей не находящихся в контексте проблем может быть неверной и надуманной.

Кстати, обсуждение появилось не на пустом месте, а на том что в data.gov.uk уже есть черновые массивы данных со структурами органов власти UK. Скачать их можно тут - http://source.data.gov.uk/data/reference/minister-dataset/ (знания работы с Linked Data необходимы). Там же файлы с описанием членов парламентов и пэров.

И, напомню что в США есть схожий проект по разработке онтологии для e-Government, называется он OEGov http://www.oegov.us. Проект сделан TopQuadrant для GSA и сделан по модульному принципу мини-онтологий.

У нас пока такого ничего нет, особенно официального или заказанного госорганами. Впрочем и не мудрено, людей интересующихся Linked Data и устройством государства у нас очень мало.

Я, в своё время пробовал моделировать структуру российских органов власти на базе OEGov, но не получилось. Универсализм там от лукавого, он не так уж удобен и не очень хорошо описан. Следующую попытку буду делать уже по готовым онтологиям АТД и нормативно-правовых документов.

Впрочем, очень сложно убеждать в полезности Semantic Web и Linked Data в ситуации когда до сих пор нет активного интереса к открытым данным.

А пока внимательно следим за тем что происходит с открытыми данными в странах лидерах.

Originally published at Иван Бегтин. You can comment here or there.

Открытые данные. И греки тоже
14 августа 10 03:21

В Греции запустили портал Geodata.gov.gr с геоданными в форматах KML, SHP, XLS, ODS. Плюс с картами через OpenStreetMap.




У нас в стране, как вы понимаете, ничего такого государственного нет.

Есть лишь частные проекты, например, GIS Lab где есть много интересных геоданных.

Originally published at Иван Бегтин. You can comment here or there.

Про онтологии АТД и базовые онтологии. Схемки
14 августа 10 01:25

Я тут набросал несколько схемок.

На первой –  онтологии госструктур/госуправления.

На второй – на третьей только геополитические онтологии

На третьей – функциональные онтологии административно-территориального деления.

Как всегда, делаю оговорку что под онтологиями я имею в виду декларативное описание той или иной предметной области в понятиях максимально приближенных к Semantic Web и Linked Data. А то есть это не просто смысловое разъяснение предмета, а его структурированное  описание.

Я эти схемки делал читая всё ту же книгу Кордонского и всей сложности государственного и административного устройства, они не показывают, но некоторое представление дают.

Собственно несколько комментариев:

1. По схемкам можно увидеть что базовая геополитическая онтология, а то есть декларативное описание структуры АТД России до субъектов – это основа основ. Собственно это то чем я ранее занимался и уже есть её OWL описание.

2. Второй ключевой онтологией является базовая нормативно-правовая онтология с описанием видов нормативных документов, их взаимосвязи и базовых правовых норм. Непосредственно на ней основана Конституционная онтология в которой и описываются основные центральные органы власти, их ответственность и функции.

3. В том что касается муниципального уровня я вывел его в отдельные геополитические онтологии субъектов федерации. При том что, да, можно, например, преобразовать справочники ОКАТО и ОКТМО в структурированное описание, однако, на мой взгляд информации в них недостаточно для полноценного описания отдельного муниципального образования. И, по хорошему, их надо сводить, также как и КЛАДР в RDF описании. Региональное деление также позволяет обеспечить итеративное моделирование, поскольку для моделирование органов власти в отдельном субъекте федерации достаточно отдельной только его геополитической онтологии региона.

4. Существует очень много функциональных онтологий основанные на структуре ряда федеральных органов власти и унаследованных от СССР делений. Часть их них охватывают только субъекты федерации, часть, особенно относящиеся к географическим и природным явлениям, завязаны на административное деление до уровня муниципальных образований. В каждом случае такой онтологии, она может содержать более сложную структуру и ссылки и свойства специфичные для данной отрасли.

Ещё одна осталась нераскрытая тема – это конвертация существующих справочников в декларативное описание. Делать ли на их основе, новые, правильные структуры, или же ссылаться на коды в этих справочниках и только.

Originally published at Иван Бегтин. You can comment here or there.

Про основы стоимости государственных сайтов
13 августа 10 07:59

Поскольку у нас тут много разных дискуссий завязалось по поводу того сколько может стоить государственный сайт, обоснована ли его цена, почему она такова, а не иная. Не «пилят ли бабло», есть ли коррупция и тому подобное.

Лично я считаю что важно понимать ту область которую подвергаешь критике.  И периодически выступаю в роли «адвоката дьявола». Вот и сейчас вопрос будет о том насколько всё непросто на самом деле в том сколько и почему стоит тот или иной веб-сайт. Текст я пишу на основе многих долгих разговоров как с чиновниками, так и с разработчиками так что видение не одностороннее.

Первый и основной тезис.

Все оценки основанные на цене контракта заключённого между госзаказчиков и поставщиком являются заниженными.

Почему? Потому как контракт предусматривает только проведение закреплённых в нём работ, в то время как при этом, может не учитываться и чаще всего не учитываются такие расходы как:

  • стоимость хостинга на период времени не менее 1 года;
  • расходы на технические сопровождение;
  • расходы на содержательное наполнение (по числу сотрудников органа власти вносящих информацию на данный сайт) в том числе и сотрудники задействованные на передаче материалов поставщику для публикации если сопровождение сайта осуществляет поставщик.
  • расходы на обновление лицензий закупленного ПО, хотя бы с оценкой в 2-3 года.

Итоговая стоимость будет выше. В зависимости от того какой сайт, всё может существенно отличаться. Но суммы на разработку госсайтов столь малы что не стоит ждать что у нас какое-то орган власти всерьёз займётся оценкой их стоимости.  Не того маштаба задача, хотя и, для большего популизма, Минсвязи или Минэкономразвития могли бы такие работы организовать.

Тезис второй.

Сайты бывают разные.

У разных органов власти разные функции, разная степень публичности, разные информационные потоки. Требования которые установлены в 8-ФЗ и последующих подзаконных актах – они минимальны. На практике, у госоргана могут быть свои реестры, к которым через сайт должен предоставляться доступ,

Рассмотрим, некоторые официальные сайты:

- Служба внешней разведки – http://www.svr.gov.ru/. Набор статических страниц и всё. Просто до безобразия.

- Росимущество – http://www.rosim.ru. Сайт вроде бы простой, но реально там на одном движке существуют все сайты территориальных управлений в субъектах федерации.

- Сайт АП России – http://www.kremlin.ru/. На самом деле там не один сайт, а группа сайтов, по видимому на одном движке.

Рассмотрим госсайты официальными не являющиеся:

- OpenClass.ru. Сетевые сообщества  -  http://www.openclass.ru/. На самом деле портал является частью большого контракта по созданию сообществ учителей и разработка и сопровождение портала – это только часть работы. А значительная часть шла, идёт, должна была идти в оффлайне.

- Русский век. Портал для соотечественников – http://www.ruvek.ru. Просто сайт, с просто публикациями, на просто CMS. Страниц там не так уж много, специфики минимум

- Портал ТрудВсем.Ру – http://www.trudvsem.ru/. Портал по поиску работы запущенный Рострудом и Минздравсоцразвития. Содержания наполняемого редакторами там мало, но за ним большая база резюме и вакансий и организационная работа по унификации и сведении данных из всех управлений Роструда на единый портал.

Смысл всех этих примеров в том чтобы показать что то что мы называем «Государственные сайты» бывает очень разным. И кроме описанных выше отличий, есть отличия по готовности инфраструктуры и того как именно производится развёртывание сайта – на существующей инфраструктуре заказчика, внешнем хостинге или разработка включает закупку оборудования.

Итого. Прежде чем оценивать обоснованность расходов на какой-либо госсайт необходима чёткая их типизация, если угодно, анкета которую надо заполнить и после чего сравнивать с другими веб-проектами на основе заполненных метрик.

Тезис третий.

Госконтракт  - это ещё и риск дополнительных издержек.

И, наконец, то о чём Вам далеко не все разработчики госсайтов расскажут. У их разработки, в отличии от многих других видов госконтрактов, есть довольно существенные риски главный из которых – это 94-ФЗ.

Почему 94-ФЗ? Да по очень простой причине. В любой коммерческой разработке, бывают ситуации когда у заказчика может поменяться ситуация, произойти перестановки в руководстве или могут произойти события увеличивающие объём работ. Так вот у любого госзаказчика руки жёстко связаны. Они не могут гарантированно обещать поставщику компенсировать превышение его расходов по той причине что для этого госзаказчику будет необходимо объявлять новую процедуру на «модернизацию» или «сопровождение» уже разработанного. А, этот конкурс на модернизацию может выиграть совсем не та организация которая понесла расходы.

Другая особенность в том что большинство технических заданий в госконтрактах, на самом деле, весьма нечётко. Очень многое отдано на откуп исполнителя и госзаказчика. Нечёткость требований приводит к тому что поставщик старается максимально сэкономить усилия зная что заказчик в любой момент может выкатить новые требования, а госзаказчик имеет возможность  для воздействия на поставщика.

Например, посмотрите на сайт правительства после пожаров – http://www.government.ru/. Как думаете появился раздел с онлайн трансляцией строительства? Я вот думаю что исполнитель контракта по сопровождению сайта в рамках существующего контракта его и делал. Этот пример совсем простой, если и более сложные примеры. Каждый раз когда Вы видите как на каком-то госсайте появляется новый раздел под какую-то недавно объявленную госинициативу, то конечно, есть вероятность что сотрудники ведомств сделали такой раздел сами, но чаще сайты не приспособлены к быстрым изменениям и делают эти разделы сопровождающие разработчики.

Итог. Контракт на разработку сайта для госоргана это всегда ещё и риск дополнительных издержек, иногда весьма существенных.

Тезис четвертый.

Притягивание непонятного к понятному.

У всей ситуации с критикой есть ещё и важный социальный аспект. Критикуя расходы на любой из госсайтов каждый из критикующих считает что он разбирается в предмете. Иногда это действительно так, но есть один нюанс. На сайты тратится невыразимо малое количество госсредств. И даже есть собрать все контракты на создание госсайтов за последние 5 лет, то всё равно один единственный контракт по строительству, например, такой, на 25 миллиардов, будет больше всех их взятых. Да и в принципе, посмотрите на список крупнейших госконтрактов для полноты мировосприятия.

Особенность госзакупок в том что это, в принципе, сложная среда. Чтобы понимать их нужно, довольно хорошо разбираться, и в предметной области и том как организуются процедуры заказов и сдача госконтрактов.

В случае сайтов, делать акцент на деньгах в случае сумм до 100 миллионов – это несерьёзно. Качество исполнения и результаты гораздо важнее.  Но об этом, почему-то, пишут редко.

———–

В качестве заключения. Вопрос критики – это вопрос целеполагания.  Акцент на стоимости, в ущерб качеству – я считаю неверным. Результат, результат и ещё результаты! Нужна не критика стоимости, а формализованные механизмы её обоснования.

А всех кто осилил этот текст до конца приглашаю на сайт ГосСети – http://www.govweb.ru/ где много  государственных сайтов и интересной информации о них.

Originally published at Иван Бегтин. You can comment here or there.

Ещё про административно-территориальное деление РФ
13 августа 10 02:10

Продолжаю размышлять над книгой Кордонского.

В приложениях к ней множество различных справочников, положений об органах власти и других материлов. Большую часть из них я знаю, но есть и то о чём не знал и то что раньше выпускал из виду.

Например, есть такие элементы АТД как:

- Закрытые административно-территориальные образования;

- Территории за пределами Российской Федерации

- Округа Пенсионного фонда

- Железнодорожные округа, по территориальным подразделениям РЖД

- Водные округа, по бассейновым управлениям

- Авиационные округа, по учреждениям в подчинении Росавиации

- Автомобильные округа, по федеральным автодорогам

- Особо охраняемые природные территории

- Геологические округа Минприроды

- Таможенные округа

и так далее, ещё штук 8 видов минимум.

Причём практически все они слабоформализованы. Фактически, они определены лишь в положениях госструктур выполняющих там свои функции. Чаще всего они состоят из групп субъектов федерации от 1 до нескольких, но иногда и структура является сложной и могут охватывать только ряд муниципальных образований и то частично.

То есть, если исходить из того чтобы декларативная онтология АТД охватывала все эти способы деления, там нужна ещё и детализация до муниципальных районов. В общем, структура усложняется.

А если ещё включить туда избирательные округа, то усложняется катастрофически, поскольку для них нужна детализация вплоть до домов и их формализация процесс очень трудоёмкий.

Да, сложно, но интересно. Жалею что нет у меня сейчас возможности заняться этой темой вплотную. Слишком много других проектов, а у описания АТД статус хобби.

Originally published at Иван Бегтин. You can comment here or there.

Читаю &laquo;Россия. Поместная федерация&raquo;
12 августа 10 04:43

Наконец-то у меня в руках оказалась книга Симона Кордонского «Россия. Поместная федерация». Мне её несколько человек рекомендовало как наиболее подробное описание административно-территориального деления РФ и вот я её практически прочитал.

Скажу Вам не тая, книга сильная. С одной стороны в ней раскрыто мноое из существующей реальности государственного устройства – территориального и управленческого. А с другой стороны там очень чётко расписана «понятийная часть» российской экономики, того как всё «есть на самом деле». Разница между «реальностью» и «есть на самом деле», там, кстати, неоднократно подчёркивается.

Конечно, людям вне контекста реформы мунициального управления, не интересующимся госуправлением и административно-территориальным делением страны, скорее всего, читать будет тяжело и неинтересно. В книге много терминов, пусть даже и подаваемых простым языком, а вот для большинства чиновников книга будет понятна сразу же.

И главный вывод там весьма интересный.

Необходимо резко упростить структуру административно-территориального деления страны и структуры государственного управления.  Для этого необходимо, например, упразднить города федерального значения и субъекты российской федерации.

Причём вывод логичен и книгу почитать точно стоит.

В общем – рекомендую без зазрения совести.

А в том что касается существующей онтологии территориального деления России, то книга на некоторые мысли меня уже навела. Но нужно время на систематизацию и понимание того как это может быть выражено декларативно, как я уже описывал это в геополитической онтологии РФ. Проблема в том что отраслевое территориальное деление требуют невозможно без онтологии структуры органов власти вплоть до территориальных подразделений/управлений. Что, в свою очередь, задача огромного маштаба, хотя и не неразрешима.

Originally published at Иван Бегтин. You can comment here or there.

Продолжение по поводу takzdorovo.ru
11 августа 10 06:50

Дмитрий Дмитриев из ЮК «Правовой департамент» опубликовал ответ РосФинНадзора по поводу сайта Takzdorovo.ru . Сходите, почитайте, ответ интересный. Они перенаправили запрос в Федеральную антимонопольную службу и Минкомсвязь России.

Зачем в Минкомсвязь России? Да по той причине что в пункте 5.11 их положения ясно написано что:

5.11. дает федеральным органам исполнительной власти заключения о целесообразности расходов на проведение научно-исследовательских и проектно-изыскательских работ по созданию и приобретению программного обеспечения и технических средств для создания и эксплуатации ведомственных информационных систем

А то есть отмазаться от выдачи такого заключения у них, я надеюсь, не получится.

Хотя, конечно, передача запроса в Генпрокуратуру или Контрольное управление Президента было бы весомее. Особенно учитывая последние поручения Чуйченко от Медведева.

А предысторию вопроса посмотрите в блоге Евгения Лернера – http://evgeniy1001.livejournal.com/tag/takzdorovo.ru он там всё подробно и точно изложил.

Я же добавлю свои 5 копеек.

Во всей этой ситуации есть две проблемы. Одна из них – это то какие требования были в конкурсе, как он проводился и как исполнялся. Там есть свои вопросы – почему все оценки членов комиссии по заявкам были одинаковыми, как туда «затесалось» требование по огромной посещаемости к моменту сдачи, от отсутствию гарантированной посещаемости в дальнейшем, чем вызвано сокрытие счетчика посещаемости ресурса несмотря на многочисленные подобные вопросы.

И другая проблема имя которой Игорь Ашманов о которой, опять же, подробно написал Евгений. У Игоря фантастическая способность настраивать против себя незнакомых ему людей даже не догадываясь кто из них чем занимается, в чём я лично, как один из критиков TakZdorovo.ru, убедился довольно скоро. Рассуждать о моральных качествах данного человека смысла не вижу, скажу так – моё мнение о нём сложилась.

Вероятность того что «Ашманов и партнёры» выиграют какой-либо госконтракт и этот контракт, конкурсная документация, протоколы не будут позже проанализированы во всех подробностях, а результаты запрошены у госзаказчика через СМИ, через запросы граждан – равны нулю. Будут разобраны и будут запрошены.

И эта история тоже не закончилась.

Originally published at Иван Бегтин. You can comment here or there.

Мысли по текущей ситуации с пожарами и дымом
10 августа 10 11:50

Жаль у нас нет режиссёров уровня Майкла Мура кто мог бы происходящее положить на документальную киноленту. Фактов, материалов, свидетелей, выступлений официальных лиц – очень много. Осталось лишь грамотно скомпоновать в нейтральной, но жёсткой форме.

Однако я о другом. Ситуация с аномальной жарой, пожарами и задымлением в крупных городах не вечная и главный вопрос что будет по её итогам. Какие будут Lessons Learned и дальнейшие действия в течении следующих 11 месяцев после которых ситуация может повторится 1 в 1.

Я и ранее публиковал свои наблюдения по информационной деятельности госорганов после различных ЧП. Про Метро 29 и про падение самолёта польской делегации.

Однако про ситуацию с пожарами, лично я считаю, что пока ещё подводить итоги рано. Имеет смысл подождать хотя бы неделю после их окончания и окончания ЧС в районах бедствий.

Пока только отдельные соображения:

1. Нехватает какой-либо взвешенной нейтральной, но жёсткой, точки зрения на происходящие события. Так чтобы без политических лозунгов, но с целенаправленным разбором ситуации в целом и по регионам.

2. Вопрос N1. Будет ли сформирована парламентская комиссия по расследованию всех обстоятельств проишедшего? Также как это делалось для СШ-ГЭС, с представлением результатов расследования в виде публичного доклада.

3. Про риски размещения камер напротив домов пострадавших написала Катерина Аксенова. Я считаю что Катерина права, вероятность публичных перфомансов ненулевая.

4. По хорошему, для каждого из ведомств должен быть проведён мониторинг в формате Lessons Learned. А то есть кросс-опрос мнений:

- граждан что думают о деятельности ведомства;

- сотрудников ведомства;

- сотрудников других ведомств о взаимодействии с данным;

Со списком худших и лучших практик.

5. Вопрос информационного штаба ликвидации подобных распределённых и долгосрочных ЧС стоит как никогда остро. Но должен ли он решаться на уровне МЧС?  А как быть с ситуациями, например, эпидемий? Однако это всё надо учесть и предусмотреть. Своё видение по этому вопросу изложила, опять же, Катерина Аксенова и Ваш покорный слуга. Разумеется эти мнения не исчерпывающие, предлагайте свои идеи, предложения или же напишите что-нужно делать отдельным подробным документом. Главное – это жёсткая и конструктивная критика.

6. Отдельный вопрос с информационным присутствием МЧС и Правительства. Например, сводка по пожарам МЧС у меня вызывает самые разные и крайне негативные эмоции. Потому как что с ней делать, совершенно непонятно. Там только самая общая самая бесполезная статистика, а если у ведомства есть аггрегированные цифры, то у них должны быть и первичные данные и идеальный случай когда раскрывалась бы следующая информация:

- все очаги пожаров таблицей, в виде CSV файла, в виде KML файла для наложения на Google Maps или Яндекс.Карты

- статистика возникновения пожаров и тушения по регионам;

- списки штабов по регионам

и так далее. Всё это относится к вопросу формирования информационного штаба. Если бы у меня сейчас небыло множества других коммерческих и общественных проектов, я бы и сам плотнее занялся этой темой. Но на десять частей не разорваться.

Пока, как-то так. Опять же мысли только предварительные. Когда всё закончится можно будет провести детальный анализ произошедшего.

Originally published at Иван Бегтин. You can comment here or there.

Открытые данные по смертности в Москве
10 августа 10 10:50

Прочитав про то что Московский ЗАГС зафиксировал рост смертности в Москве я не поленился и заглянул на их сайт в раздел статистики

Данные за 2010 год там есть, вплоть до июля 2010 года, однако, как ведается  про такое понятие как открытые данные они совсем не знают и таблички в виде которых они публикуют информацию малопригодны для работы. Приходится их конвертировать и преобразовывать в нечто более пригодное.

Для тех кто хочет поработать со статистикой смертности в табличной форме прикладываю файл Excel’я moscow_death с основной таблицей, производными данными и графиками. Данных там немного, зато они актуальны как никогда.

А также привожу графики.

График по изменения абсолютного числа смертей за последние 19 месяцев с января 2009 по июль 2010 включительно.

График сравнения числа умерших за 2009 и за 2010 годы по месяцам в абсолютных цифрах.

График сравнения изменения числа умерших в 2010 году к числу умерших в 2009 году по месяцам.

Вообще же, конечно, нехватает списки причин смерти и машиночитаемости эти данных чтобы не пришлось их выковыривать по одной записи из двух таблиц.

А графики, конечно, можно сделать посимпатичнее. Предоставленный файл позволяет Вам сделать это самостоятельно.

Originally published at Иван Бегтин. You can comment here or there.

Почему я занимаюсь открытыми данными
09 августа 10 06:09

Мне тут нередко задают один и тот же вопрос в самых разных формах, но звучащий примерно так: а чего ты занимаешься этими открытыми данными, наверное есть какая-то выгода?

Думаю что вопрос заслуживает того чтобы подробно на него ответить.

Зачем я занимаюсь открытыми данными.

1. Сбором информации в самых разных формах я занимаюсь уже много лет, лет 8 как минимум, это то о чём я уже писал как про инфогикство. Это просто интересно само по себе, главное не забывать «выкапываться» из куч банков данных.

Первая выгода - заниматься тем что интересно

2. Во всём мире движение в сторону открытости данных  сейчас просто таки лавинообразное. Свои порталы по открытости появялются у отдельных муниципалитетов в Европе и Северной Америке. А порталы по PSI появляются даже в Африке. Я считаю что появление российского государственного портала data.gov.ru это вопрос исключительно времени и к тому времени когда станет понятно чтна о решение о его создании принято, то быть существенной частью команды которая его сделает. Может быть даже и возглавить часть этого проекта, как знать.

Вторая причина – создание центра компетенций по открытым данным, открытому государству

3. Открытые данные – это не столько ценность сама в себе, а фундамент для построения множества связанных проектов. При правильном их раскрытии, повторное использование может дать целую массу коммерческих и общественных областей где эти данные могут быть применены. Подмешивание данных о статистике поисковыми системами – один из таких примеров. Знание того как с этими данными работать и как их использовать даёт дополнительные возможности в запуске других проектов.

Третья причина – новые возможности, новые проекты

4. При наличии понимания того как можно использовать открытые данные, то, в частности, на их основе разрабатывать специальные алгоритмы которые могут иметь как прямую так и косвенную коммерческую ценность.  Например, я давно собираю массивы данных из ФИО персон и даже знаю ряд совершенно публичных и открытых. Зачем? Потому как это позволило сделать с одной стороны простой, а с другой точный алгоритм определения пола по ФИО и, с меньшей точностью, национальную принадлежность. А также на основе типовых шаблонов написания ФИО, разбирать их в любой форме написания. Из той же серии мои посты про «расшифровку реальности». Когда знаешь с помощью каких именно источников данных можно обогатить тот или иной код, то можно получить весьма интересную информацию.

Четвертая причина – интересные производные продукты

—-

В общем-то всё просто до безобразия.

Originally published at Иван Бегтин. You can comment here or there.

Рында как национальная идея
05 августа 10 10:31

Я тут читаю что пишут про блоггера попросившего рынду, что ему наотвечали, да и про все СМИ что теперь про рынду пишут тоже читаю.

Честно, говоря, не смог остаться в стороне. К тому же немного расстроился от дефицита креатива вокруг темы рынд для населения. Я считаю что это просто необходимо восполнить.

Я так считаю – тема «рынды«, до сих пор раскрыта не вполне. Хотя в виду остроты и актуальности потребностей в них – рында, как понятие, как часть жизни для многих граждан, вполне могла бы быть национальной идеей.

Просто необходимо эту ситуацию развить и сделать следующее:

Государственное

1. Минрегионразвития России инициировать федеральную целевую программу «Развитие системы раннего аудиооповещения населения в сельской местности» (шифр «Рында»).

2. Предложить Камазу и Автовазу наладить выпуск автомобилей оборудованных рындами. Предложить потребителям рынды разного размера, звона, комплектации. Специальные рынды для женщин с утончённым звуком. Обязательно снабдить инструкцией как бить склянки, отбивать азбуку морзе и т.д.

3. Первому каналу и ВГТРК провести серию передач на темы: «История рынды»  и «Корабельный колокол спасения», «Роль рынды в Великой отечественной войне», «Неизвестная рында». Раскрыть трагическую историю этого предмета от нужности до бесполезности с развитием современных технологий.

4. РосНано организовать конкурс на создание «нанорынд». Особенных не только миниатюрностью, но и способностью издавать звуки несмотря на свои размеры.

5. Ростехнологиям наладить производство «ЭлектроРынды». Специального прибора оснащённого ГЛОНАСС, работающего от солнечных батарей и передающего звуки идентичные звуку рынды и способного заменить обычную рынду и телефон.

6. Россвязи дополнить переносной рындой каждый киоск с видеотелефоном устанавливаемых в удалённых регионах.

7. МЧС запланировать в нескольких регионах учения «Рында-2011″ включающие проверку мобилизации населения с помощью рынд в сельской местности.

Политическое

8. КПРФ разработать специальные лозунги и плакаты «При коммунистах были рынды!».

9. Единой России разработать общественно-политическую инициативу «Рынду в каждый дом!».

10. Оппозиции взять на вооружение лозунг: «Верните, суки, нашу рынду!»

А я лично считаю что рында – это прекрасный подарок на новый 2011 год. Ведь в следующем году тоже будет лето, дым, пожары и рынды. Встречать лето 2011 года без рынды, будет просто таки немодно.


Originally published at Иван Бегтин. You can comment here or there.

Ссылки на 05.08.2010: Работа с данными онлайн
05 августа 10 09:29
Инструменты
  • Socrata – проект с большим количеством «социальных данных». Наполняется пользователеями
  • InfoChimps – с некоторых пор не только коллекция банков данных, но и площадка для продажи своих массивов.
  • FreeBase Gridworks – удобный инструмент по чистке данных от команды Freebase
  • IBM ManyEyes – великолепный сервис графиков от IBM
  • OpenStructs – инструменты для работы со структурированными данными. Включая расширения для Drupal
  • Google Fusion Tables – сервис для работы с таблицами от Google
  • GeoCommons – визуальная аналитика по геоданным
  • Tableau Public – бесплатный продукт по визуализации данных от Tableau Software. Даже со всеми его ограничениями – загрузка только из Excel, Access и CSV и не более 100 000 записей, попробовать стоит.

Данные

  • Government Data Catalogs – каталог каталогов открытых данных от Sunlight Labs
  • Data.ed.gov – открытые данные департамента образования США

Originally published at Иван Бегтин. You can comment here or there.

Postedfrom Иван Бегтин | 0 Comments    
Как могло бы выглядеть информирование о ЧС
05 августа 10 12:13

В продолжение прошлого поста где я всех приглашал к обсуждению моделирования ЧС с точки зрения информационного присутствия на сей раз изложу подробно свои мысли на сей счёт.

Коротко написать не получится, поэтому будет длинный и подробный текст.

Цели и требования

На мой взгляд решить проблему с информационным вакуумом в момент любого ЧС невозможно только технологически. Технологии должны существенно дополнять и помогать, но в основе всё равно будет организационная работа.

Для информационной поддержки усилий по ликвидации ЧС я вижу следующие цели которые одновременно являются требованиями ко всему процессу информирования:

1. Оперативность. Информация должна публиковаться столь оперативно сколь это только возможно. Практически, немеделенно.

2. Официальность. Информация должна быть официальной, а то есть исходить от сотрудников ответственных ведомств.

3. Технологичность. Информационная поддержка должна осуществляться таким образом чтобы гражданам было _максимально_ удобно получать информацию и с ней работать.

4. Вовлечение. Обязательное участие граждан в помощи пострадавшим, волонтёрстве, участии в ликвидации ЧС и так далее.

Собственно на этих 4-х правилах и должно происходить информирование о событиях.

Типизация ЧС

Далее о самих ЧС. Чтобы понять какая именно информационное присутствие должно обеспечиваться, прежде необходимо понять с типизацией чрезвычайного происшествия.

Например, ситуация с одиночным террактом сильно отличается от общероссийской ситуацией с пожарами по всей стране.  Есть разница в маштабе, территориальной распределённости, в том какая помощь может исходить от граждан, в оперативности освещения и так далее.
Навскидку, несколько типов ЧС:
-  Терракт
-  Природная или техногенная катастрофа в виде единичного очага
-  Природная или техногенная катастрофа  со множеством очагов и территориальной распределённостью
- Авиатранспортное проишествие
- другие  типы катастроф (предлагайте ваши варианты)
Тезисы
Далее тезисно:
1. Для публикации информации о ЧС необходимо в кратчайшие сроки после подтверждения что оно произошло создание отдельного информационного канала в сети только по тем данного ЧС.
2. Сроки создания канала должны зависеть от типа катастрофы. В случае терракта или авиатранспортного происшествия – не позднее чем через 2 часа, в случае природной или техногенной катастрофы в течении 8 часов как крайний срок, оптимальный срок 3 часа.
3. Данный канал информации должен быть технически отделён от других ресурсов и быть, либо разделом одного из официальных сайтов органов власти, либо отдельным сайтом с запоминающимся названием.
4. Например, ресурс по массвым пожарам в 2010 году мог бы выглядеть как поддомен сайта МЧС   pozhar210.mchs.gov.ru или ogni2010.ec.gov.ru (ec – сокращение от EmerCom). Но это лишь один из вариантов. Главное – простота запоминаемости.
Организация
Далее об организационной части работы, последовательность организационных действий:
1. Сразу после появления отдельного ресурса по чрезвычайной ситуации начинает работать его редакция и все новости касающиеся данной ЧС, в первую очередь попадают именно туда.
2. Ответственное ведомство, либо предоставляет доступ пресс-службам других ведомств для самостоятельной публикации, либо получает от них новости и публикует на этом центральном ресурсе с соответствующей пометкой.
3. В дальнейшем вся информация оперативно публикуется именно здесь и является официальной.
Что делать?
И, наконец, что же должно быть, какая информация должна присутствовать и как это должно выглядеть.
Я считаю что это должен быть конструктор сайтов с возможностью сверхбыстрого развертывания. Причём этот конструктор должен позволять быстро создавать сайты нескольких типов с разными блоками – под разные типы катастроф.
Например, список блоков по теме «Пожары 2010″:
1. Официальная информация
- новости и публикации официальных органов власти;
- документы и нормативные акты;
2. Карта – наглядная карта с отображением пожаров, центров сбора помощи, штабов, территориальных подразделений МЧС и др. ответственных органов.
3. Как помочь?. Раздел с информацией о том как и где граждане могут помочь. Включая:
- список некоммерческих организаций занимающихся помощью пострадавшим
- реквизиты счетов на которые можно перечислять помощь пострадавшим;
- участие в ликвидации последствий и так далее.
- информирование о возгораниях
4. Фотографии и видео – материалы с мест событий
6. Контакты – телефоны и контакты всех ведомств вовлечённых в решение проблем.
- МЧС
- Минздрав
- Роспотребнадзор
- Рослесхоз
- Прокуратура
Как должна подаваться информация:
1. С возможностью быстрого распространения – отправив в Twitter, Facebook, соц. закладки и так далее.
2. С возможностью подписки на новости, документы и обновления списков пострадавших в том числе по территориям. Должна быть возможность получать последние новости только в своём федеральном округе или своей области
3. С машиночитаемостью. У СМИ и у информационных проектов должна быть возможность отобразить официальную информацию в своих системах. Поэтому, например, геоданные должны распространяться так чтобы их могли отобразить и на других веб сайтах. Например, в формате Google KML.

P.S. Пока я писал этот документ, Катерина Аксенова опубликовала своё видение подобного проекта в виде концепции которую почитать можно тут - http://www.gosbook.ru/document/6237

Видение подобного проекта у нас с Катериной очень похоже – приглашаю всех обсудить, и мой текст выше, и документ Катерины на сайте ГосБука.

Originally published at Иван Бегтин. You can comment here or there.

Моделирование чрезвычайных ситуаций с точки зрения информационной поддержки
04 августа 10 12:57

На фоне российских пожаров предлагаю Всем тему для обсуждения.

Рассмотрим ситуацию с тем что происходило когда происходили чрезвычайные ситуации вроде взрывов в метро и происходящих сейчас пожаров. Однако рассмотрим не просто так, а с точки зрения информационной, донесения информации до людей, координации их действий и так далее.

Далее тезисно:

  • госструктуры практически всегда действуют со значительной задержкой. И даже когда начинают публиковать информацию делают это исключительно новостями и документами. Ни один сайт органа власти, кроме разьве что МЧС, да и тот не особенно не может быть быстро доработан для новой темы;
  • точно также ни один из органов власти до сих пор не был способен запустить информационный проект в органиченные сроки, до 1 недели, по причине отсутствия своих разработчиков, 94-ФЗ, бюрократизованности и так далее
  • при этом отдельные граждане успевают оперативно отреагировать и запустить такие сайты как Metro29 http://metro29.ru/ и Russian Fires http://russian-fires.ru/ (кстати, уже лежит под нагрузкой)
  • в случае подобных пожарам по всей стране, тема оказывается столь злободневной, что спецпроекты запускают информационные компании. К таким проектам можно отнести проект Яндес: Лесные пожары http://pozhar.yandex.ru/ и Пожары в системе Космоснимки http://fires.kosmosnimki.ru/, однако и тот и тот являются исключительно информационными.
  • как и органы власти, российские НКО не реагируют, либо реагируют со значительной задержкой.

Как резюме происходящего.

1. Есть проблема с оперативностью органов власти в части донесения информации до граждан.

2. У нас то ли нет специализированных НКО, то ли те что есть крайне нерасторопны, но слышно про самостоятельную волонтёрскую активность граждан и ничего не слышно про активности НКО.

Далее вопрос:

Как принципиально решить две ключевые проблемы?

- информирование граждан;

- координация волонтёрских усилий, сбор средств пострадавшим;

Я считаю что вариантов здесь всего несколько:

1. МЧС наконец-то, задумаются о том что система оповещения граждан – это не экраны и не репродуктуры и создадут структуру по срочной информационной поддержке в случае критических ситуаций.

2. МЧС, Минздрав или лучше сразу Правительство договорятся с одной из информационных компаний о срочном (в течении 6 часов после начала события) запуске проектов по информационной поддержке.

3. Появление НКО способных собирать информацию от госструктур и координировать деятельность волонтёров самостоятельно.

А в качестве близкого примера, предлагаю всем промоделировать ситуации:

1. Крушение самолёта с гибелью от 100 человек и более.

2. Прорыв Саяно-Шушенской плотины.

Ваши идеи и предложения?

Originally published at Иван Бегтин. You can comment here or there.

Дайджест на 8.03.2010. Пожары, проекты, новости
03 августа 10 03:53

Поскольку материалов и новостей самых разных очень много я решил их все скинуть одним постом полу-тезисами.

Проекты и темы

1. Появился проект russian-fires.ru по координации помощь людям пострадавшим при пожарах. Правильный идеологически и на хорошей платформе Ушахиди, но без обратной связи с создателями и выглядит как проект одного человека. Это не уменьшает ценности проекта, но для меня в который раз показывает недостаточную оперативность гос-ва и НКО и высокую оперативность отдельных граждан.

2.  Про этот же проект и другие активности госорганов по тушению пожаров в блоге  у Екатерины Аксеновой http://gov-gov.ru/?p=1794#comments

3. Американцы запустили новую версию Федерального регистра http://www.federalregister.gov/ который неслучайно напоминает гражданский проект GovPulse http://www.govpulse.us/ поскольку разработчики новой версии сайта регистра наняли активистов из GovPulse для помощи. Подробнее в блоге SunLight Labs http://sunlightlabs.com/blog/2010/meet-the-new-federal-register/

Социальные сети

4. Губернатор Хабаровского края Вячеслав Шпорт завёл Твиттер http://twitter.com/vshport/ и активно там пишет, в том числе отвечая тем кто ему задаёт вопросы.

5. ГосБук постепенно наполняется материалами и участниками. И моя активность также, в значительной степени идёт там. Советую туда заглядывать или подписаться на посты, думаю что будет ещё много интересных документов.

Наши «Антигерои»

6. Управление Роскомнадзора по Красноярскому краю отличилось тем что публикует собственные планы-графики размещения заказа в виде отсканированных документов смотрим тут http://24.rsoc.ru/contests/p5969/

7. С 9 июля Министерство Финансов нашей с Вами федерации перешло к публикации бюджетной росписи от формата XLS к формату PDF. Смотрим тут http://www1.minfin.ru/ru/budget/federal_budget/budj_rosp/. И хорошо ещё не сканами.

Моя деятельность

8. В последнее время я меньше пишу в блоге и могу отвечать на комментарии, поскольку много проектов уже идёт и до конца лета немало организационных вопросов которые сейчас решаются. Однако много нового ещё предстоит, оставайтесь на линии.

P.S.

Я ищу разработчиков на Python + Django для существующих и планируемых проектов в области открытого государства, гражданского общества и так далее. Если есть интерес – пишите мне на ibegtin@gmail.com, а лучше сразу присылайте резюме, пожелания по зп. и т.д.

Originally published at Иван Бегтин. You can comment here or there.

Есть ли Радикальная честность на практике?
02 августа 10 10:32

Кстати, вот такой ещё один вопрос для всех, а практикуете ли Вы или знаете ли кого-либо кто практикует Радикальную Честность (по английски можно почитать тут – http://en.wikipedia.org/wiki/Radical_Honesty) по русски в блоге Алексея Каптерева – http://kapterev.livejournal.com/562610.html.

В одной из серий Теории Лжи, кстати весьма любопытный сериал, жаль нет времени его смотреть, был эпизод с одним из героев которые как раз эту самую радикальную честность исповедовал. Не то чтобы с большим успехом для себя, но уже кое-что.

На мой взгляд, ключевое в этом не _стремление_к_честности_любой_ценой_, а активная разгрузка мозга. Снятие с него хотя бы части расчётных задач о том кому что сказал, кому что говорить нельзя, правильного моделирования диалогов и так далее.

Но ведь любопытно, нет?

Я в своё время тоже экспериментировал с этой методикой и понял что в бытовом общении и личной жизни использовать её, лично мне несложно. Достаточно чётко понять темы на которые говорить что отвечать не будешь, в остальном всегда говорить правду. Не очень то сложно, на самом деле.

А вот то что касается общественной деятельности или коммерческой деятельности, тут совсем иное. Слишком много вариантов при которых радикальная честность негативно отразится нехорошо даже не на себе, а на других людях. Ну да, я думаю, Вы и сами с подобным сталкивались.

И, всё таки, есть ли кто-то кто эту методику практикует?

Originally published at Иван Бегтин. You can comment here or there.

Postedfrom Иван Бегтин | 0 Comments    
Filed under:
Нужна ли в России НКО по Открытым данным и институализация этой темы?
01 августа 10 10:41

У меня есть вопрос к читателям и вопрос довольно серьёзный.

Необходима ли в России некоммерческая организации специализирующаяся именно на открытых данных?

Не то чтобы у нас никто не занимается доступностью информации, формах её

Например, есть такие некоммерческие организации и фонды как фонд Викимедия или  Институт развития свободы информации, есть ИРИО и ИНСОР и ряд менее известных.

Но это всё несколько иное. А вот чего-либо похожего на Open Knowledge Foundation и «институализации» открытости данных и знаний у нас нет. Оговорюсь что под институализацией я имею в виду формирование общественного института и среды понимания этой темы. Придание формального статуса и целый комплекс инициатив.

Так вот готовы ли мы к этому и в какой форме это могло бы существовать?

Например, я лично считаю что практически да, готовы. Такая структура необходима, либо как отдельная, либо как самостоятельная часть другой НКО.

Но не сказать чтобы нет сомнений. Например, у меня есть сомнения в том что будет возможность существенного фандрайзинга от граждан. По моему опыту что такое открытые данные приходится объяснять, разъяснять и убеждать.

Похожая ситуация с тем, будет ли возможно привлечь поддержку коммерческих предприятий. Я знаю несколько десятков компаний специализирующихся на системах аналитики, обработки данных и, даже, построении онтологий, а также компаний чей бизнес построен на доступности информации. Однако, не скажу что уверен в их готовности действовать на создание общественного блага.

И наконец, государственные и окологосударственные инициативы. Например, в виде создания российского аналога Data.Gov, но врядли это означает появление новой структуры, скорее это тот формат который я описал как самостоятельная часть уже имеющегося.

Что думаете?

Originally published at Иван Бегтин. You can comment here or there.

Благотворительность как общественное благо
01 августа 10 09:48

Тема немного оффтопом по сравнению с тем о чём я обычно пишу у себя в блоге, но отвлекаюсь от темы e-Gov и технологий я редко – так что на сей раз о благотворительности.

Ещё с момента SocialCamp (жаль сайт socamp.ru уже не открывается) меня не покидает та мысль что, по своей сути, благотворительность в России – это то же общественное благо.

И, в общем-то, готовность граждан участвовать в благотворительной деятельности и то как они это делают – это показатель их готовности участвовать в любых других общественно полезных гражданских и социальных инициативах.

Одна из моих идей была в запуске баннерной сети по соц. рекламе, где любой владелец сайта мог бы размещать у себя только социальную рекламу, тем самым такую рекламу можно было бы показывать даже на посещаемых ресурсах где коммерческая рекламы быть бы не могла.  Усилий от участников было бы немного, но результат был бы определённо.

Но, честно говоря, после немалого числа обсуждений этого проекта – его актуальность сошла на нет. В ситуации когда, например, Google даёт благотворительным организациям гранты на размещение у себя социальной рекламы, подробнее тут http://www.google.ru/grants/, и когда, баннерные сети в принципе, отмирают – тема остаётся невостребованная.  И при том что мне, лично, по прежнему хотелось бы найти форму в качестве которой она стала бы актуальной, пока верного рецепта нет, да и много других общественно полезных проектов которыми я занимаюсь, те, же РосГосЗатраты, ГосСеть и OpenGovData.ru

Так вот про благотворительность. Одна из Российских особенностей в том что у нас от передачи средств на благотворительность нет никаких налоговых бонусов, вычетов и тому подобного. То есть для любого гражданина – такой шаг это гражданская позиция, а для юридического лица, также гражданская позиция руководства или часть публичного позиционирования компании, так называемая, социальная ответственность.

Мне, честно, говоря очень любопытно, почему у нас в России до сих пор нет проектов вроде ChipIn, JustGiving и IdeaList позволяющих очень быстро собирать средства, но, все как привязаны исключительно к PayPal и кредиткам? Незнаю. Но это было бы самое что ни на есть общественное благо. Но как его создать?

Венчурное финансирование и стартапы тут совершенно неподходят. Вообще. Потому как если изначально настраивать подобный проект на окупаемость, значит необходимо брать процент с транзакций или с благотворительных организаций, что заранее определит отношение к проекту.

Государственные гранты, вроде грантов общественной палаты – это такой редкий сыр в мышеловке и, честно говоря, как человек мониторящий госрасходы не один год, я ещё могу представить как узнать результаты госконтрактов и результаты такие видел, а вот результатов работы или хотя бы какой-то регламентированной публичности по расходам по грантам что-то не попадалось. В общем, верится с трудом.

Благотворительные фонды, по моему опыту, даже если у них бывают средства, не будут готовы сами тратить их на технологическую разработку.

Европейские гранты или же гранты каких-либо мировых организаций, опять же, ни разу не видел чтобы кто-то на них создавал что-то общественно полезное и технологичное одновременно.

Поэтому вопрос как в России формировать среду для проектов того что можно было бы называть Благотворительность 2.0, 3.0 и тому подобное – я хочу адресовать Вам, поскольку сам этого ответа не нашёл.

И да, далее отдельная часть поста, которую можно и нужно репостить.

—-

Есть такой благотворительный фонд «Жизнь как чудо» там собирают средства для детей больных очень редкими и сложными заболеваниями. Собирают как правило, очень большие суммы и это как раз один из тех случаев когда помочь можно только деньгами или возможностью их привлечь. Фонд, разумеется официальный, со всеми отчетами, реквизитами и замечательной командой и собирают средства целенаправленно на каждого конкретного ребёнка когда появляется такая необходимость. Если у Вас есть возможность помочь хоть небольшими средствами, то прямо сейчас там собираются средства для Людмилы Иваненко.

Лично я, по мере своих возможностей, так и сделал поскольку считаю что это не только персональная помощь одному человеку, но и то самое общественное благо которое создаётся существованием людей готовых эту помощь оказать.

Originally published at Иван Бегтин. You can comment here or there.

This Blog

Archives

Syndication