Май 2011 - Posts

Латиница в госзакупках 2011. Существенное продолжение.
31 мая 11 05:32

Про латиницу в госзакупках в этом году я писал ранее, в том числе вот тут – http://ivan.begtin.name/2011/05/30/latin2011/.

А теперь, следуя традиции, после первого вводного поста обязательно идет существенное продолжение и вот оно.

Кроме латиницы есть ещё один более чем эффективный способ «искажения слов» – это пробелы между буквами. Его минус в том что это искажение заметно визуально, но плюс в том что фильтры нацеленные на смешение кириллицы и латиницы тут не срабатывают.

Я знаю что примеры таких закупок ранее бродили по сети. Например, вот тут – http://zakupki-news.livejournal.com/81648.html

То есть проблема известная и понятная. Однако. Мы же за системный и автоматизированный подход и лично меня один пример ну никак не устраивает. Если уж считать то хотя бы десятками, лучше сотнями, а когда примеров тысячи – так просто красота да и только.

Впрочем, хватит лирики, перейдем к конкретными примерами. По ссылке latin_2011_more обновленный Excel файл со списком закупок. На сей раз в файл добавлена вкладка «Пробелы» где собрано 2054 закупки в тексте которых есть хотя бы одно слово записанное в виде букв разделенных пробелами. Определялось это простым образом – закупка попадала в список если в названии встречалось хотя бы 4 кириллических символа разделенных пробелами.

Конечно, ряд случаев, как всегда – это ошибки. В ряде других «ошибки» весьма интересны ибо они попадают точь-в-точь по ключевому слову. Например, поставка лекарственных препаратов, салициловой кислоты, п и р о з о л о н а, парааминофенола и прочих (группа №44) обратим внимание на слово «п и р о з о л о н а»

или же открытый аукцион в электронной форме № 323 – о а э ф – 11/р по размещению заказа на поставку реагентов для и м м у н о ф е р м е н т н о г о анализатора e l e c s y s 2010 и тест полосок для анализатора р е ф л о т р о н п л ю с для г у з «республиканский онкологический диспансер»

да и вот ещё открытый аукцион в электронной форме № 67 – о а э ф -11/лп по размещению заказа на поставку лекарственного препарата «п а к л и т а к с е л», предназначенного для обеспечения льготных категорий граждан, имеющих право на набор социальных услуг, для министерства здравоохранения республики мордовия

Ну да там много, особенно, почему-то, по медицинской теме.

Конечно, никого здесь нельзя огульно обвинять, однако, то что есть с чем разобраться, это точно.

Про выводы я уже говорил – вся ответственность здесь лично на Шувалове, начиная с того момента как Медведев ему поручил с проблемой разобраться.

Originally published at Иван Бегтин. You can comment here or there.

Обратная сторона медали
31 мая 11 10:43

Поговорим о не лучших сторонах общественной жизни.

Чем дольше я занимаюсь проектами которые можно назвать общественными, тем больше и больше возникает пересечений с тем что называется «политтусовкой». Причем лично у меня складывается впечатление что при всей разнице (а она есть?) во мнениях – манеры общения да и среда общения у всей этой политбратии общая – вбросы, игра на «черно-белых темах», давление на эмоции и так далее.

Например, если ещё недавно стоило мне написать своё мнение про деятельность А. Навального его сайта Роспил как тут же набегали представители его фан. клуба, то теперь мои посты начинают ретранслировать представители противоположного лагеря. Я могу лишь предположить что у движения «НАШИ» очень плохо идут дела раз они начинают на меня ссылаться, иначе обратили бы внимание о чем я пишу все эти годы и насколько это далеко от всего чем они занимаются.

И если деятельность Навального в части госзакупок (обращайте внимание на это уточнение) я считаю по прежнему вредной, то деятельность «НАШИ» вокруг «белых фартуков» и прочей борьбы с коррупцией – просто отвратительно. Мало того что из проблемной темы устраивается шоу с перекрытием дорог, так и ситуация та же что и с Навальным – минимум «новых смыслов» и максимум PR. Иначе говоря – это пустышка. Нет ничего что имеет «долгую волю» и, самое главное, осмысленный результат.

Относительно же Навального, то последний его проект – РосЯма выглядит вполне прилично, и по формату, и по вовлечению граждан. Может быть даже он когда-нибудь  догонит Пермский Streetjournal – http://streetjournal.org. В любом случае – конкуренция в это хорошо. Конкуренция в области общественного блага – ещё и полезна. Так что с ямами у Навального получается явно лучше, в отличии от закупок.

И наоборот. Стоит опубликовать какие-либо критичные материалы по той или иной госструктуре или гос. персонам, как это начинают ретранслировать деятели с повышенной концентрации ненависти к стране. Другая крайность и не сказать навскидку какая из них хуже.

Возникает такое чувство что все эти «лагеря мнений» исходят из позиции что «все кто не нами, против нас». Но на самом деле это один лагерь – «политпиарщиков» и «политтехнологов» разного окраса.

В принципе же всё это «бинарное мышление»  значительной части людей лично меня существенно раздражает. Собственно это одна из ключевых причин которая сдерживает от того чтобы создавать многие другие общественные проекты – вроде российского OpenCongress, мониторинга выборов/полит. партий и многих других. Их сделать несложно. Больше того, ничего кроме воли здесь ненужно, даже денег ненужно, на самом деле. Главная проблема – в общественной реакции, в удержании нейтральности. Лично мою веру в человечество эта реакция расшатывает, а я не люблю когда расшатывают мою веру в человечество.

Потому и сейчас я лично на распутье выбора – заниматься чистой воды общественной деятельностью, запускать новые проекты, преодолевая растущую мизантропию, или же сконцентрироваться на открытых данных и на развитии темы общественного блага с точки зрения бизнеса в этой сфере.

Originally published at Иван Бегтин. You can comment here or there.

Латиница в госзакупках 2011
30 мая 11 01:10

Если кто помнит, в 2009 году я уже публиковал список закупок с латиницей в названиях. Тогда это было ещё только по федеральному официальному сайту, а теперь у нас уже 5 месяцев сайт новый и для меня был большой вопрос с тем как обстоит с латиницей и другими способами сокрытия информации на новом сайте.

И, как ни странно, результаты есть. Не то чтобы совершенно неожиданно, но, могло быть и по другому.

Как бы то ни было в Excel файле с этим постом latin_2011 прилагаю список из 800 закупок в которых встречается латиница, определялось это по наличию в одном слове одновременно кириллических и латинских символов и список из нескольких десятков закупок где в названии начисто отсутствуют ключевые слова.  Таких случаев немного, но и выявить их гораздо тяжелее. Потому как я сейчас охватил только те случаи когда называния простые вроде «поставка товаров», а есть и более сложные случаи.

А вот и несколько примеров:

- закупки с коротким названием «поставка товара» http://zakupki.gov.ru/pgz/public/action/orders/info/common_info/show?notificationId=499747 и http://zakupki.gov.ru/pgz/public/action/orders/info/common_info/show?notificationId=620914

- закупка со словами в которых латинские и русские буквы присутствуют http://zakupki.gov.ru/pgz/public/action/orders/info/common_info/show?notificationId=404198

в слове Меdoniс первые две буквы и последняя буква кириллические.

ну и так далее. Проще открыть Excel файл и шагать по нему последовательно. При этом, конечно, есть случаи когда смешение букв – это нормально. Например, ГЛОНАСС/GPS. Но, вот случаи вроде плановое техническое обслуживание системы инактивации вирусов в плазме крови МАСОTRONIC где первые 4 буквы кирилиические и которое даже не подсвечивается (интересно почему) как неправильное на сайте – это мало напоминает случайность.

Что можно сказать:

1. «Латиница в госзакупках» на сайте есть и немало.

2. Идея подсветки слов с латиницей на сайте порочная. Во первых она не работает (предположим что из-за технических проблем, а не из-за вмешательства персонала). Во вторых она не дает объективной картины и того факта предпринимались ли какие-либо действия по устранению.

3. Кроме латиницы есть и другие способы сокрытия заказов вроде написания текстов без ключевых слов, вроде «поставка товаров» или «услуги».

Что делать – я писал уже не раз ранее. Решение в премодерации извещений оператором официального сайта, но с тех пор как на единый сайт собрали все закупки включая муниципальный заказ – это весьма непросто в реализации. Но необходимо, безусловно необходимо.

А вот кто виноват это известно. Помнится мне Медведев поручал разобраться с этой ситуацией Игорю Шувалову – http://blog.kremlin.ru/post/24.

Лично я считаю что он не справился. Выводы каждый может сделать для себя сам.

Originally published at Иван Бегтин. You can comment here or there.

Инфографика речей Медведева с коррекцией на нормальные формы слов
29 мая 11 11:56

Как Вы помните я совсем недавно размещал карты слов/тэгов по речи Медведева у себя в блоге. Это такая довольно забавная инфографика сгенеренная с помощью Wordle и многим она нравится.

Но, с этой инфографикой есть одна небольшая но существенная проблема. В русском языке слова в зависимости от падежа и других способах их изменения меняют своё написание. В результате если в тексте упоминается общество как слово «общество» и как слово «обществу» и как «обществом», то это будут разные слова и итоговую частоту упоминания не словоформы, а смысла мы теряем. И единственный способ это преодолеть – это подсчет упоминаемости не слов, а их нормальных форм.

Ну а поскольку я периодически и сам берусь за клавиатуру дабы не потерять навыки, то буквально за час я набросал скрипт который использовал движки PyTagCloud для визуализации и pymorphy для приведения слов к нормальным формам. Причем из этого часа больше половины времени ушло на то чтобы подобрать хорошую визуализацию.

Как всегда, в роли экспериментальных кошечек использовались речи Дмитрия Медведева, что, впрочем, не должно ограничивать других в экспериментах над другими речами.

Итак, я подобрал несколько примеров. В каждом случае вначале буду приводить картинку без нормализации слов и потом из нормальных форм слов

Дмитрий Медведев выступил на конференции «Великие реформы и модернизация России» - http://www.kremlin.ru/transcripts/10506

Текст как есть без нормальных форм

Текст с нормальными формами слов

Послание Президента Федеральному Собранию 30 ноября 2010 года – http://www.kremlin.ru/transcripts/9637

Текст как есть без нормальных форм

Текст с нормальными формами слов

Послание Федеральному Собранию Российской Федерации 12 ноября 2009 года – http://www.kremlin.ru/transcripts/5979

Текст как есть без нормальных форм

Текст с нормальными формами слов

Как видите во всех случаях ключевые слова речи меняются. Например, в речи про реформы без приведения слов к нормальной форме, слова «страна» и «свобода» были лишь одними из ключевых, а после приведения слов они стали самыми ключевыми. В остальных случаях каждый может посмотреть самостоятельно что да как.

А исходный код можно посмотреть вот здесь – https://github.com/ivbeg/ruspytagmap, там же желающие и обладающие навыками работы с Python’ом могут, и просто поиграться с текстами, и сделать русский аналог Wordle.

Originally published at Иван Бегтин. You can comment here or there.

Про ДВИФ и выступления в Хабаровске
26 мая 11 04:54

Итак, для сегодня (по Хабаровскому времени) я отвыступался на Дальневосточном интернет форуме (http://www.dvif.org), а вчера выступал в ТОГУ.

Оба дня я говорил про открытые данные и то к чему они нужны и к чему они приводят. Говорил про конкурсы на их основе и отдельно говорил о проекте «Государственные люди».

Начну с выступления в ТОГУ.

Тема была «Открытые данные», а сама лекция проходила в здании Тихоокеанского государственного университета. Слушали меня их студенты, как я понимаю, ИТ-шный курс. Аудитория, при этом, не очень подготовленная.

Я выступал специально в интерактивном режиме и задавал вопросы, многие ли знают что такое открытые данные, или что такое XML. Про открытые данные знали единицы, про XML около трети аудитории. Все выступление я проговорил про то что такое открытые данные, какие порталы открытых данных существуют в мире, какие конкурсы по открытым данным проводятся и под конец лекции показал несколько порталов по открытым данным в живом режиме. Показывал – data.gov.ru, data.gov, datagov.ru, opengovdata.ru и РосГосЗатраты.  Вопросов от студентов было совсем немного – 7 или 8 всего.

Впечатления смешанные. С одной стороны были те кто слушал внимательно и задавал вопросы осмысленно, с другой стороны далеко не все знали даже про то что сейчас в Хабаровске идет ДВИФ и там есть интересные ИТ темы. Однако я искренне надеюсь что хотя бы пару человек мне удалось побудить задуматься о том что такое открытые данные и как их использовать.

На следующий день, а то есть сегодня, я выступал непосредственно на ДВИФе. Причем выступал я много поскольку Катерина Аксенова, увы, к сожалению, не смогла приехать и я в скором темпе подготовил ещё два выступления – анонс конкурса по открытым данным и мастер-класс по проекту «Гослюди». Итого было три выступления.

В первом выступлении я рассказал об открытых данных, государственных инициативах в этой области и так далее. На сей раз говорил я подробно, со множеством примеров того как открытые данные используются и для чего. Вопросов сразу было очень много – о том на какие деньги проекты создаются, что можно было бы сделать для Хабаровска, какие данные есть и доступны и так далее и многое другое. На сей раз чувствовалось что аудитория пришла подготовленная и вопросы задавали весьма осмысленные.

После первого моего доклада выступила чиновница города Хабаровска Ольга Пустынникова и рассказывала про автоматизацию города. Ей не повезло тем что её доклад был после моего и сразу же по окончанию её забросали вопросами о том когда же открытые данные появятся в Хабаровске. Увы, ответа так и не было, в повестке администрации тема явно не стояла, однако учитывая настойчивость многих спрашивающих, чувствую теперь там об этом задумаются.

Далее был второй мой доклад. В этом докладе я рассказывал про то какие конкурсы по открытым данным есть в мире. Такие как Apps for Development, Code 4 America, NYC Big Apps и других. Там же я анонсировал первый российский конкурс по открытым данным Apps4Russia. Скажу сразу – это предварительный анонс! Официально конкурс начнется ближе к концу июня, не все описание конкурса доступно, не все жюри собрано и так далее.

Но это конкурс людей для людей – за ним нет компаний спонсоров, нет государства. За ним только физ. лица небезразличные к открытым данным и их использованию.

Доклад, также встретили с интересом, но вопросов почти небыло, видимо все вопросы прошли ещё после первого моего выступления.

И, наконец, в третьей части я рассказал про то как создавался проект Государственные люди, как была создана первая его версия, добавлялись рейтинги, топ записей, API и многое другое. По моим ощущения интерес к этой теме также был.

Фактически секция была во многом в виде моего соло и вроде как удалось её вытянуть.

Для меня ДВИФ закончен и я возвращаюсь завтра утром в Москву, вылетаю в 10:00 по хабаровскому времени и прилетаю в 11 с чем-то по московскому.

ДВИФ мне понравился, как и сам Хабаровск. Город красивый и весьма благоустроенный, красивые площади, фасады зданий, в принципе ощущение цивилизации, а форум был хорошо организован.  Не будь Хабаровск столь далеко, с удовольствием бы ездил сюда чаще.

Originally published at Иван Бегтин. You can comment here or there.

Wordle идет в массы
24 мая 11 03:22

После моей публикации с текстом Медведева появилось много публикаций с использованием Wordle и это не может не радовать!

А тем кому понравилось Wordle рекомендую также посмотреть на вот этот инструмент – http://www.tagxedo.com/app.html

Originally published at Иван Бегтин. You can comment here or there.

Памятка по журналистике данных
22 мая 11 01:22

Возможно, кто-то из Вас уже ранее слышал этот термин «журналистика данных» или «data driven journalism«. Если нет, то всячески рекомендую начать со статьи Евгении Шевниной в Mediapedia, заметку в блоге NewMediaLine – 10 фактов о журналистике данных, а также статью в блоге Сергея Рачинского –  Журналистика баз данных: Модный тренд или будущее профессии?

Итак.

Что же такое журналистика данных?

Журналистика данных – это совмещение журналистом роли переводчика с экономического/государственного/цифрового языка в язык понятный всем и, одновременно, роли аналитика представляющего материалы в предельно наглядной форме. Это могут быть списки, графики, интерактивные карты, специальные веб-компоненты которые позволяют отображать данные разными специальными способами и так далее.  Во всех случаях текст здесь является вспомогательным, а не основным инструментом. Эта особенность существенно меняет и форму подачи материалов. Информацию гораздо сложнее сделать эмоциональной, но и одновременно она куда более наглядна, поскольку один список или одна картинка, один график могут быть куда более наглядными чем тысячи слов.

Зачем это нужно?

Первая и ключевая причина – это наглядность подобного способа представления информации. Это позволяет охватить и удержать аудиторию которая не всегда готова вчитываться в большие тексты, но хорошо понимает их визуальное представление. Это одновременно, и упрощение подачи материалов, и усложнение процесса их подготовки. Журналистика данных – это новый тренд, явление которое сейчас проявляется в очень многих странах мира, в виде отдельных проектов крупных медиахолдингов и в виде личных датаблогов посвященных визуализации различной общественно значимой информации. Иначе говоря, для многих журналистов – это возможность получить признание и занять пока ещё пустующие ниши в медиапространстве. Учитывая что журналистика данных сейчас на подъеме и к не приходят все большее число СМИ, это может более чем востребовано в ближайшем будущем.

Пример: Guardian Datablog

В качестве заметного примера можно привести блог данных газеты Guardian в Великобритании. Этот блог, который можно назвать также отдельной редакторской колонкой, существует уже более 2-х лет, в нем опубликовано более 1000 постов на тему открытых данных, визуализации существующей информации, графики и списки сделанные редакцией и многое другое.

Это блог который и изначально вел один журналист Симон Роджерс (Simon Rodgers), а теперь туда пишет более 5 журналистов Guardian и пишут ежедневно, от 2-х до 4-х публикацией в сутки.

Из последних примеров – список заключенных Guantanomo и дефицит бюджета Великобритании

Пример: Los Angeles Times: Data Desk

У Los Angeles Times есть свой проект по данным который называется Data Desk. Это в меньшей степени работа журналистов и в большей степени редактора и команды программистов поскольку в Data Desk публикуются данные  и списки, они накладываются на карту Калифорнии или делаются в иной интерактивной форме. Фактически – это сервисы, над открытыми данными. В некоторых из них они берут информацию из существующих общественных проектов и сужают срезы только до Лос Анжелеса или до Калифорнии.

В чем сложности и ограничения

Главное ограничение – это необходимость навыков работы с рядом аналитических и технических инструментов. Это включает такие инструменты как Excel, Google Docs, IBM ManyEyes, Wordle и многие другие. Далеко не все журналисты обладают  навыками работы с этими инструментами и большинство из тех кто такими навыками обладают понимают то как необходимо подавать материалы в понятном медиа-формате.

Второе ограничение – это сравнительно невысокая доступность баз данных по России. У нас далеко не столь много общедоступной информации в структурированном виде чем в Великобритании или в США. У нас нет общероссийского государственного портала по открытым данным, нет специальных разделов с открытыми данными на сайтах органов власти и так далее. Зачастую даже если информация есть, её необходимо искать и преобразовывать.

Впрочем, на мой взгляд, это не неразрешимая задача. Данных у нас немало, особенно данных касающихся различных финансовых вопросов – бюджетов, индикаторов Центробанка и даже статистики по сдаче ЕГЭ.

Поэтому главное ограничение всё таки человеческое, чтобы вести темы в журналистике данных нужны заинтересованные в этой теме журналисты.

Как начать?

Я знаю что некоторые издания в России публикуют инфографику и результат анализа некоторых госданных, но, пока это происходит несистемно. Не в сфокусиронованном формате на открытые данные, на публичность государства, на понятность того что пишется.

Если Вы журналист, то задуматься и попробовать вести блог в формате журналистики данных. Предложить такой формат Вашей редакции. Вполне может быть что этот формат окажется востребованным аудиторией.

Если Вы редактор, то вполне возможно что журналистика данных – это именно то чего нехватает Вашему изданию и этот пост хорошая точка для старта.

Важно задать правильный формат изначально. Установить формат именно как журналистики данных, делать это в контексте открытых данных во всем мире.

С чего начать

В августе 2010 года в Европе прошла конференция по Data Driven Journalism и её отчет доступен онлайн http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf

В этом документе есть много примеров того как журналистика данных работает и используется по всему миру. Там же немало ссылок на инструменты которые журналист данных может использовать в своей работе.

А также существует немало инструментов доступных онлайн, я перечислю ключевые из них:

1. Google Docs – https://docs.google.com/

Сервис работы с документами и таблицами от Google. Помимо того что позволяет публиковать таблицы из Excel’я онлайн, для всеобщего доступа, там также есть возможность строить графики на основе этой информации.

2. Wordle – http://www.wordle.net

Wordle – это сервис по созданию «карт текста». Вы загружаете туда документ, а он подсчитывает частоту упоминаемости слов и наглядно отображает их в виде инфографики.

Пример визуализации ответов Медведева с его пресс-конференции я приводил совсем недавно.

3. IBM ManyEyes – http://www-958.ibm.com/software/data/cognos/manyeyes/

IBM ManyEyes – это сервис визуализации данных в форме различных графиков, наложения их на карты (мира или США) и построения ряда редких и наглядных графиков вроде Bubble Chart.

В 2010 году я публиковал бюджет Москвы на ManyEyes и скажу Вам что для визуализации сравнений – это бесподобный инструмент и не самый сложный.

Приложение. Ссылки

Каталоги открытых данных

Ссылки по визуализации

Инструменты, большая подборка

Руководства/Рекомендации

Originally published at Иван Бегтин. You can comment here or there.

Выступление Медведева в инфографике
21 мая 11 07:42

Текст был взят отсюда – http://news.kremlin.ru/news/11259

В нем были оставлены только ответы Медведева, а картинка была изготовлена загрузкой текста в сервис Wordle где она также доступна по адресу http://www.wordle.net/show/wrdl/3659014/D.Medvedev_18.05.2010_answers

А вообще есть хороший движок WordCram (http://wordcram.org/) и проект по визуализации речей политиков – это вполне себе хорошая идея.

Originally published at Иван Бегтин. You can comment here or there.

Понятное государство
21 мая 11 05:24

Чем дальше тем больше я прихожу к выводу что одна из проблем коммуникации граждан и государства или бизнеса и государства, в том что очень многие государственные процессы гражданам и бизнесу непонятны. Где-то по причине их сложности, где-то по причине их сознательной или унаследованной скрытости. Причем где-то эта скрытость суть производная от сложности и отсутствие разъяснений происходящего на _понятном_ языке, а где-то, что чаще, от целенаправленных усилий по сокрытию этих процессов от тех кого они затрагивают.

По сути эта непонятность и есть антипод прозрачности и подотчетности. Непонятность порождает ограничения  зачастую не имеющие простых решений. Ограничения требующие специальных знаний для их преодоления. Ограничения которые являются исскусственными, а не естественными.

Эти ограничения можно назвать административными барьерами. Можно назвать бюрократией, можно подобрать более хлесткие термины, однако cути это не изменит – государство отделено от граждан не только чиновниками, информационными системами, но и специальной терминологией сильно усложняющей жизнь гражданам. Фактически чиновники и граждане говорят на разных языках и перевод между этими языками затруднен.

Вопрос в том как это изменить.

Я знаю то как это меняют в мире. В основном переводчиками являются СМИ. Журналисты берут непонятные законы, привлекают экспертов и описывают изложенное там на понятном языке. Качество этого изложения можно назвать качеством работы СМИ. Его трудно измерить численно, но всегда можно ощутить субъективно. Каждая такая публикация – это как хорошо проведенное расследование.

А также, например, любая хорошо сделанная инфографика – это перевод с непонятного языка цифр и терминов в понятный визуальный продукт. Это то что делает государство _понятным_ или хотя бы делает понятным часть деятельности госструктур.

В некоторых странах эту проблему понимают очень хорошо. В материалах по контентной стратегии Великобритании, о которых я ранее уже писал здесь (http://ivan.begtin.name/2011/05/18/contentstrategy/) есть очень четкие рекомендации по простоте изложения материалов.

В частности, там есть такие советы:

  • Put the most important information first in links, titles, and phrases
  • Remove excess words and avoid big words where smaller more everyday words would do the same job
  • Use specialist language and jargon only when it is well known by your audience

И в переводе:

  • Ставьте наиболее важную информацию в первые ссылки, заголовки и фразы.
  • Убирайте ненужные слова и избегайте сложные слова там где простые, более повседневные слова являются синонимами.
  • Используется специализированный язык и жаргон только если он хорошо известен вашей аудитории.

Вот тут их можно прочитать все – http://coi.gov.uk/guidance.php?page=145

Похожие рекомендации есть у архивной службы Новой Зеландии – Guide to Best practice in Storage

И в руководстве по внесению материалов на Новозеландский портал Business.govt.nz – Content provider guidelines

А вот Шотландский буклет с рекомендациями по подготовке законов на простом языкеPlain language and legislation

Ещё ссылки:

Конечно, большая часть материалов по понятности/непонятности – это юридические материалы. И большая часть мировых движений в области понятного языка и понятного государства крутятся вокруг законов и иных официальных документов. Но не только.

Когда я упоминаю проекты Sunlight Foundation (США) или Open Knowledge Foundation (EU), то большая их часть это также трансформация непонятного в понятное. Они берут какую-либо актуальную тему и из разрозненных материалов по ней создают новые смыслы которые объясняют происходящее. Это касается, например, проектов ClearSpending и Where does our money go.

Эти организации предпринимают усилия сделать ключевые области деятельности государств понятными. И им это удается. Пусть не очень быстро, но целенаправленно и результативно.

И про нашу ситуацию.

У нас с понятностью большая беда. Даже президент любит употреблять термины и жаргоны далекие от большинства граждан. Незнаю кто пишет ему речи, но что там не «plain language» – это точно. У нас большая часть законов пишутся таким языком что их просто невозможно читать. Приснопамятный 94-ФЗ необходимо переписывать полностью уже по этой причине – он целенаправленно непонятен. Многие положения в нем далеко не случайно оказались запутанными и усложненными.

Многие другие законы ничуть не лучше. Но что хуже, так то что у нас нет инициатив по изменению этой ситуации. Точно также и гражданские и общественные проекты. Есть очень немного проектов носящих разъяснительный характер, переводящих непонятное в понятное. Например, проект AskJournal который делали Transparency International, вполне себе на качественном уровне объясняет многие сложные понятия.

Или, например, лекции Теории и практики или беседы от первого лица Полит.ру. Это также перевод знаний со сложного языка специалистов в понятный язык для граждан.

Что делать

Ничто не меняется само по себе. Сделать что-либо понятным можно только если будут те кто смогут сделать это понятным. В текущей социальной среде это очень непросто, не только и не столько из-за государственного давления на общество сколько из-за дефицита активных и не политизированных граждан. Разъяснять сложнее чем кричать лозунги, да и политических дивидентов не приносит. Однако это возможно. Лично у меня бродит в голове идея что создание проекта «Понятное государство» – необходимо. В формате лекций, статей, выступлений, объединения тех кто способен переводить на нормальный русский с русского специализированного. Нам также необходимо движение «простой русский язык». Словари перевода с юридического и искаженного чиновничьего языка на язык нормально воспринимаемый всеми. Как это организовать я пока незнаю ибо и так уже практически на пределе собственных временных возможностей занимаюсь рядом других проектов, но ищу решение. И если у Вас есть собственные идеи как можно начать нечто подобное у нас в стране, то предлагаю это обсудить всем вместе.

Originally published at Иван Бегтин. You can comment here or there.

Дальневосточный Интернет Форум
21 мая 11 04:37

С 24 по 26 числа включительно я буду присутствовать и выступать на Дальневосточном интернет форуме – http://www.dvif.org

Говорить буду, как всегда, про открытые данные и то что можно сделать на их основе.

Я там буду не один, будет немало и других докладчиков. Программу форума можно посмотреть здесь http://dvif.org/programma.pdf

Originally published at Иван Бегтин. You can comment here or there.

Отчет McKinsey о больших данных – Big Data: The next frontier for innovation, competition and
20 мая 11 11:48

Известные всем McKinsey выпустили отчет об использовании и возможностях использования больших данных в США и мире. Прочитать его можно по ссылке http://www.mckinsey.com/mgi/publications/big_data/pdfs/MGI_big_data_full_report.pdf

Там широко охвачены 5 тем:

- здравоохранение (США)

- госуправление (Евросоюз)

- розничная торговля (США)

- производство (весь мир)

- данные о личном местонахождении (весь мир).

Лично я отчет рекомендую почитать поскольку он из тех документов где доступным языком доносятся мысли о важности данных до ЛПР (лиц принимающих решения) которые, обычно, не всегда осознают все возможности и ограничения что данные приносят.

Там немало примеров и это один из немногих документов где читая про «инноватику» можно не морщиться ибо то что сейчас происходит со сбором, анализом и последующим использованием данных иначе как инновационной областью не назовешь.

Сейчас, в принципе, в США сразу несколько сильных стартапов получили развитие именно в области данных.

Это Socrata, Greenplum, Vertica, Aster Data, ApiGee, Aspera, Datastax, nPario, Acunu,Metaweb (Freebase), GoodData, Factual и десятки других. Каждую из компаний можно найти через гугл. Все они делают бизнес на обработке огромного объема данных,часть из них используют готовую облачную инфраструктуру, часть других скупают крупные игроки вроде IBM, Google, HP, EMC и Terradata и предлагают как решения разворачиваемые в своих датацентрах.

Originally published at Иван Бегтин. You can comment here or there.

Исследовательские материалы по прозрачности и открытым данным
19 мая 11 07:23

На сайте университета Rutgers (государственный университет Нью Джерси) опубликовали несколько десятков исследовательских работ посвящённых прозрачности и подотчетности государства, а также открытым данным.

По ссылке можно  найти полный список документов  - http://spaa.newark.rutgers.edu/home/conferences/1stgctr/papers.html

В частности там есть такие материалы как:

и много, много других. Однако ничего про Россию и про постсоветские страны, кроме Украины, там нет.

Originally published at Иван Бегтин. You can comment here or there.

Контентная стратегия
18 мая 11 01:12

Весьма интересная тема, также относящаяся к публичности государства и к системности его присутствия в сети.

Есть такое понятие как Content Strategy – которое включает в себя комплекс мер по подготовке, размещению и сопровождению материалов публикуемых в сети. И даже есть две конференции посвященные этой теме – Confab (http://confab2011.com/) и CS Forum (http://2011.csforum.eu/).

Как я понимаю эта тема сильно перекликается с Информационной архитектурой, но с заходом от другого конца – не от дизайна и удобства использования, а от удобства понимания и содержания. Но суть одна – создание среды для максимально комфортного способа донесения информации до потребителя и обеспечение удобной и эффективной обратной связи.

Как это касается органов государственной власти? Да самым прямым образом. Органы власти тратят средства на содержательное сопровождение веб-сайтов, но готов поручится об заклад что в России ни одна из госструктур не оценивает эффективность и понятность того что они публикуют, иначе говоря, не обладает контентной стратегией.

А вот в блоге DRCC появился обзор материалов по британской политике создания госсайтов – http://blog.drcc.co.uk/how-much-does-your-website-cost-part-one где в 3-й части идет описание мер предпринимаемых правительством UK по обеспечению качества веб-сайтов. В частности руководство «Measuring website quality» включает описание качества редакторского сопровождения (Editorial quality) откуда можно увидеть, например, следующие требования и рекомендации.

Я перевел пару абзацев:

—-

73. Редакторское качество или качество содержания – это ключевой индикатор качества веб-сайта.  Содержание должно быть актуальным, простым в понимании, корректным по тону и содержанию. Существует несколько способов измерения и улучшения качества содержания, к примеру:

  • Отзывы пользователей;
  • Наличие руководств для редакции
  • Соответствие руководствам редакции (через автоматические инструменты)
  • Мониторинг по ключевым словам

74. Все веб-сайты должны иметь четко написанную стратегию которая включает детальное описание о том кто может вносить и подтверждать публикацию содержания.  Все материалы должны мониторится и проверятся на соответствие руководствам для редакции. Это включает проверку на соответствие кодексу гражданской службы [Civil Service Code], к примеру выступления и посты в блогах проверяются на то что они политически нейтральны.

Остальные абзацы там также стоит почитать. Например, в части рекомендаций избегать специального жаргона.

Originally published at Иван Бегтин. You can comment here or there.

Портал открытых данных города Вена
18 мая 11 09:53

Власти города Вена запустили городской портал по открытым данным – http://data.wien.gv.at/

Ничего необычного для таких порталов, просто много данных, много геоданных с возможностью наложить на карты различные объекты.

И, конечно, лицензия Creative Commons – http://data.wien.gv.at/nutzungsbedingungen/

Originally published at Иван Бегтин. You can comment here or there.

Впечатления от конференции по «правоприменению»
18 мая 11 08:48

Весь вчерашний день, 17-го числа, я был в Питере на конференции по правоприменению. То бишь о том как исполняются принятые законы и прочие официальные документы.

В частности там была секция про использование сети Интернет для мониторинга правоприменения, где я собственно и находился и даже чего-то говорил.

Собственно вот мои впечатления и вообще что там было.

1. Много было разговоров об использовании опыта Википедии, Creative Commons, об общественном использовании информации созданной до 1991 года (в Советском союзе), но никаких выводов небыло, только разговоры.

2. Была большая презентация о том почему же люди в России используют пиратское ПО/фильмы/музыку. В общем, ничего нового – перечисление экономических, инфраструктурных и социальных причин.

3. С моей стороны была реплика о том что на подавляющем большинстве госсайтов нет условий использования информации и о каком регулировании других правоотношений в Интернете может быть речь если наше гос-во и само «сапожник без сапог». В то время как в мире уже появляются такие сущности как «Open Government License»

4. Выступала с презентацией представитель РАЭКа. Все бы хорошо, но совершенно не к месту. Вместо материалов по делу была «презентация-визитка». Что отметил также один из ведущих.

5. Некоторые из выступавших буквально «перехватывали» инициативу. Например, представитель ФСО, вместо реплики просто зачитал с бумаги на 3 листа описание их системы ГСРПА pravo.fso.gov.ru. Это было тем более удивительно, зная что несмотря на то что такая система есть и на неё тратятся огромные деньги, тем не менее на сайтах органов власти почему-то стоят интерфейсы от Гарант’а или Консультант’а со сканами документов, а не интерфейсы от ГСРПА.

6. Далее была дискуссия зачем ФСО делает эту систему если есть аналогичная система у Минюста. Я в этой дискуссии сильно удивился отчего же государство тратит средства на создание дублирующих систем и, раз такое дело, не пора ли объединить Минюст и ФСО – раз уж полномочия пересекаются. Это была почти шутка.

7. Во второй части круглого стола были выступления тех кто занимался мониторингом правоприменения – представители порталов zakonia.ru, zakon.ru и Юристы Онлайн. Все упоминали как именно они это делают, собирают проблемные ситуации о которых пишут граждане и подготавливают собственные экспертные оценки.

8. Я не удержался от вопроса о том зачем они мониторят сайты вместо того чтобы поработать с жалобами которые граждане подают в органы власти. На что услышал что: а. Жалобы – это не Интернет. б. Жалобы им никто не даст.

Правда ни у одного из органов они эти жалобы и не пытались получить, а насчет того что «не Интернет» – это, конечно, ересь.

9. Несколько раз поминали Навального. Подошедший к круглому столу Коновалов (министр юстиции нашей с Вами федерации) также упомянул что деятельность Навального полезна для государства, с оговоркой что это не касается его политических утверждений и критики конкретной партии. Также Коновалов предложил использовать похожие механизмы мониторинга коррупции, но в рамках госгрантов (правда непонятно как ибо грантовая модель финансирования в России плохо проработана).

10. Далее там немало выступали Венедиктов и Засурский на тему того что прозрачность принятия решений важна для общего доверия граждан власти. И то что мониторинг правоприменения также должен быть прозрачен.

11. Коновалов вел себя весьма естественно, на редкость для министра. Это чувствовалось, и по выступлениям, и по мимике.

Общее же впечатление было как бал вампиров сходить. Вокруг одни юристы. Все в костюмах, кроме интернет-деятелей кто был в casual, но их было совсем мало. Много всяких терминов. Даже мониторинги Интернета они делают через свои юр. сайты.

Originally published at Иван Бегтин. You can comment here or there.

Новые проекты – хорошо переделанные старые
18 мая 11 07:11

Совсем недавно прошли два анонса создания новых и изменения существующих проектов в области e-Government и открытых данных.

Эти два проекта – explore.data.gov и alpha.gov.uk

Explore.Data.gov – это новое поколение проекта Data.gov. Там проделали коллосальную работу и преобразовали все открытые данные публикуемые в CSV формате в данные для проекта Socrata и вынесли интерфейс к Socrata на домен explore.data.gov.

Если кто не помнит, Socrata (http://www.socrata.com) – это такой SaaS сервис для госорганов по публикации открытых данных онлайн. Сервис оказался чрезвычайно удобным и сейчас используется в нескольких штатах США, нескольких федеральных ведомствах и теперь на Data.gov.

В общем они молодцы, обскакали Microsoft с их Azure и Google которые вообще, похоже, мало приложили здесь усилий. Впрочем я думаю что шансы на то что Socrata будет выкуплена Google, Microsoft или Amazon’ом – очень велики.

Второй проект alpha.gov.uk проект, в некотором смысле, уникальный.

Британцы решили создать новый сайт правительства совместив его с сайтом госуслуг, только не в нашем российском понимании, а в полноценных госуслугах – советах, рекомендациях, руководствах, онлайн сервисах и так далее вынесенных на единый госсайт. Делали его, конечно, не с нуля, а хорошенько набив шишек на direct.gov.uk и других госсайтах.

Катерина Аксенова хорошо описала этот проект у себя в блоге http://gov-gov.ru/?p=2337, к её тексту я добавлю лишь то что этот сайт в той форме смог появится во многом и благодаря политике раскрытия информации через Data.gov.uk данные откуда послужили ингридиентами для alpha.gov.uk

Оба эти проекта означают две важные вехи в публичности государств в сети.

1. Explore.data.gov – новый уровень доступности и машиночитаемости данных. Унификация доступа к государственным базам данных.

2. Alpha.gov.uk – новый уровень публичности и качества разработки государственных веб-сайтов.

Originally published at Иван Бегтин. You can comment here or there.

О проектах по контролю за госрасходами в Мире
16 мая 11 11:40

Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:

Частные и некоммерческие проекты:

  • AidData (http://aiddata.org) – собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в виде базы PLAID, также доступной у них на сайте. У проект сильная методология сведения очень разнородных данных и сейчас они реализуют важную и сложную задачу геокодирования мест помощи, отмечая их на картах стран где идут международные программы.
  • Where Does Our Money Go (http://wheredoesmymoneygo.org/) – проект Open Knowledge Foundation (http://www.okfn.org), одного из наиболее заметных центров компетенции по открытым данным. В этом проекте собраны данных о бюджете Великобритании, Италии, Израиля, Германии и многих других стран. Много инфографики, в основном по Великобритании, и конечно доступность всего как открытых данных. А также материалы по их подходу к анализу госрасходов здесь – http://wiki.openspending.org
  • ClearSpending (http://sunlightfoundation.com/clearspending/) проект Sunlight Labs, одного из сильнейших центров компетенции по открытости государства и открытым данным в США. Они пошли по пути анализа качества раскрываемых данных и произвели детальный анализ соответствия раскрываемых данных по госзаказу и бюджетам ведомств. У них качественно поставлена методология и визуализация устройства бюджетного процесса – http://sunlightfoundation.com/clearspending/animation/
  • zIndex (http://www.zindex.cz/) – чешский проект активистов по мониторингу госзаказа. Они чем-то отдаленно похожи на Роспил.инфо, но без политического пиара. Каждый конкурс детально разбирается и преподается весьма детально и понятно. Почитайте его Wiki – http://wiki.zindex.cz и все станет на свои места. Да, материалы там на чешском так что лучше воспользоваться сервисами вроде Google Translate.
  • FedSpending (http://www.fedspending.org/) – проект по мониторингу госконтрактов в США. Один из первых подобных проектов в мире и именно он стал основой будущего правительственного проекта UsaSpending.gov
  • Disclosed.ca (http://www.disclosed.ca/) – канадский проект по агрегации всех госконтрактов. Не самый методологически проработанный, но работающий. Создан НКО – Visible Government, которые также отдают все данные как открытые данные (https://github.com/visiblegovernment)
  • Government Expenses (http://www.governmentexpenses.ca/) ещё один канадский проект визуализирующий бюджет. Тоже не забывают об открытых данных.
  • РосЗатраты (http://www.rosspending.ru) – российский проект созданный по заказу ИНСОРа.

Итого:

1. Всегда контроль госрасходов идет с акцентом на открытые данные. Их создание или их использование.

2. Главные акценты – доступность информации, разъяснения, сравнения, анализ.

3. Предельные выводы по перерасходу средств и другим нарушениям делаются только после детального анализа и публикации разъяснений. С обязательными оговорками что это предположения (пример, zIndex).

4. Ни один из проектов не является «политическим», вокруг них вообще нет PR и серьёзного внимания СМИ.

А вот то чего нехватает в России в части публичного мониторинга госрасходов так это мониторинг за ФЦП и другими госпрограммами и визуализация бюджетов.

Originally published at Иван Бегтин. You can comment here or there.

О проектах по контролю за госрасходами в Мире
16 мая 11 11:40

Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:

Частные и некоммерческие проекты:

  • AidData (http://aiddata.org) – собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в виде базы PLAID, также доступной у них на сайте. У проект сильная методология сведения очень разнородных данных и сейчас они реализуют важную и сложную задачу геокодирования мест помощи, отмечая их на картах стран где идут международные программы.
  • Where Does Our Money Go (http://wheredoesmymoneygo.org/) – проект Open Knowledge Foundation (http://www.okfn.org), одного из наиболее заметных центров компетенции по открытым данным. В этом проекте собраны данных о бюджете Великобритании, Италии, Израиля, Германии и многих других стран. Много инфографики, в основном по Великобритании, и конечно доступность всего как открытых данных. А также материалы по их подходу к анализу госрасходов здесь – http://wiki.openspending.org
  • ClearSpending (http://sunlightfoundation.com/clearspending/) проект Sunlight Labs, одного из сильнейших центров компетенции по открытости государства и открытым данным в США. Они пошли по пути анализа качества раскрываемых данных и произвели детальный анализ соответствия раскрываемых данных по госзаказу и бюджетам ведомств. У них качественно поставлена методология и визуализация устройства бюджетного процесса – http://sunlightfoundation.com/clearspending/animation/
  • zIndex (http://www.zindex.cz/) – чешский проект активистов по мониторингу госзаказа. Они чем-то отдаленно похожи на Роспил.инфо, но без политического пиара. Каждый конкурс детально разбирается и преподается весьма детально и понятно. Почитайте его Wiki – http://wiki.zindex.cz и все станет на свои места. Да, материалы там на чешском так что лучше воспользоваться сервисами вроде Google Translate.
  • FedSpending (http://www.fedspending.org/) – проект по мониторингу госконтрактов в США. Один из первых подобных проектов в мире и именно он стал основой будущего правительственного проекта UsaSpending.gov
  • Disclosed.ca (http://www.disclosed.ca/) – канадский проект по агрегации всех госконтрактов. Не самый методологически проработанный, но работающий. Создан НКО – Visible Government, которые также отдают все данные как открытые данные (https://github.com/visiblegovernment)
  • Government Expenses (http://www.governmentexpenses.ca/) ещё один канадский проект визуализирующий бюджет. Тоже не забывают об открытых данных.
  • РосЗатраты (http://www.rosspending.ru) – российский проект созданный по заказу ИНСОРа.

Итого:

1. Всегда контроль госрасходов идет с акцентом на открытые данные. Их создание или их использование.

2. Главные акценты – доступность информации, разъяснения, сравнения, анализ.

3. Предельные выводы по перерасходу средств и другим нарушениям делаются только после детального анализа и публикации разъяснений. С обязательными оговорками что это предположения (пример, zIndex).

4. Ни один из проектов не является «политическим», вокруг них вообще нет PR и серьёзного внимания СМИ.

А вот то чего нехватает в России в части публичного мониторинга госрасходов так это мониторинг за ФЦП и другими госпрограммами и визуализация бюджетов.

Originally published at Иван Бегтин. You can comment here or there.

О проектах по контролю за госрасходами в Мире
16 мая 11 11:40

Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:

Частные и некоммерческие проекты:

  • AidData (http://aiddata.org) – собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в виде базы PLAID, также доступной у них на сайте. У проект сильная методология сведения очень разнородных данных и сейчас они реализуют важную и сложную задачу геокодирования мест помощи, отмечая их на картах стран где идут международные программы.
  • Where Does Our Money Go (http://wheredoesmymoneygo.org/) – проект Open Knowledge Foundation (http://www.okfn.org), одного из наиболее заметных центров компетенции по открытым данным. В этом проекте собраны данных о бюджете Великобритании, Италии, Израиля, Германии и многих других стран. Много инфографики, в основном по Великобритании, и конечно доступность всего как открытых данных. А также материалы по их подходу к анализу госрасходов здесь – http://wiki.openspending.org
  • ClearSpending (http://sunlightfoundation.com/clearspending/) проект Sunlight Labs, одного из сильнейших центров компетенции по открытости государства и открытым данным в США. Они пошли по пути анализа качества раскрываемых данных и произвели детальный анализ соответствия раскрываемых данных по госзаказу и бюджетам ведомств. У них качественно поставлена методология и визуализация устройства бюджетного процесса – http://sunlightfoundation.com/clearspending/animation/
  • zIndex (http://www.zindex.cz/) – чешский проект активистов по мониторингу госзаказа. Они чем-то отдаленно похожи на Роспил.инфо, но без политического пиара. Каждый конкурс детально разбирается и преподается весьма детально и понятно. Почитайте его Wiki – http://wiki.zindex.cz и все станет на свои места. Да, материалы там на чешском так что лучше воспользоваться сервисами вроде Google Translate.
  • FedSpending (http://www.fedspending.org/) – проект по мониторингу госконтрактов в США. Один из первых подобных проектов в мире и именно он стал основой будущего правительственного проекта UsaSpending.gov
  • Disclosed.ca (http://www.disclosed.ca/) – канадский проект по агрегации всех госконтрактов. Не самый методологически проработанный, но работающий. Создан НКО – Visible Government, которые также отдают все данные как открытые данные (https://github.com/visiblegovernment)
  • Government Expenses (http://www.governmentexpenses.ca/) ещё один канадский проект визуализирующий бюджет. Тоже не забывают об открытых данных.
  • РосЗатраты (http://www.rosspending.ru) – российский проект созданный по заказу ИНСОРа.

Итого:

1. Всегда контроль госрасходов идет с акцентом на открытые данные. Их создание или их использование.

2. Главные акценты – доступность информации, разъяснения, сравнения, анализ.

3. Предельные выводы по перерасходу средств и другим нарушениям делаются только после детального анализа и публикации разъяснений. С обязательными оговорками что это предположения (пример, zIndex).

4. Ни один из проектов не является «политическим», вокруг них вообще нет PR и серьёзного внимания СМИ.

А вот то чего нехватает в России в части публичного мониторинга госрасходов так это мониторинг за ФЦП и другими госпрограммами и визуализация бюджетов.

Originally published at Иван Бегтин. You can comment here or there.

О проектах по контролю за госрасходами в Мире
16 мая 11 11:40

Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:

Частные и некоммерческие проекты:

  • AidData (http://aiddata.org) – собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в виде базы PLAID, также доступной у них на сайте. У проект сильная методология сведения очень разнородных данных и сейчас они реализуют важную и сложную задачу геокодирования мест помощи, отмечая их на картах стран где идут международные программы.
  • Where Does Our Money Go (http://wheredoesmymoneygo.org/) – проект Open Knowledge Foundation (http://www.okfn.org), одного из наиболее заметных центров компетенции по открытым данным. В этом проекте собраны данных о бюджете Великобритании, Италии, Израиля, Германии и многих других стран. Много инфографики, в основном по Великобритании, и конечно доступность всего как открытых данных. А также материалы по их подходу к анализу госрасходов здесь – http://wiki.openspending.org
  • ClearSpending (http://sunlightfoundation.com/clearspending/) проект Sunlight Labs, одного из сильнейших центров компетенции по открытости государства и открытым данным в США. Они пошли по пути анализа качества раскрываемых данных и произвели детальный анализ соответствия раскрываемых данных по госзаказу и бюджетам ведомств. У них качественно поставлена методология и визуализация устройства бюджетного процесса – http://sunlightfoundation.com/clearspending/animation/
  • zIndex (http://www.zindex.cz/) – чешский проект активистов по мониторингу госзаказа. Они чем-то отдаленно похожи на Роспил.инфо, но без политического пиара. Каждый конкурс детально разбирается и преподается весьма детально и понятно. Почитайте его Wiki – http://wiki.zindex.cz и все станет на свои места. Да, материалы там на чешском так что лучше воспользоваться сервисами вроде Google Translate.
  • FedSpending (http://www.fedspending.org/) – проект по мониторингу госконтрактов в США. Один из первых подобных проектов в мире и именно он стал основой будущего правительственного проекта UsaSpending.gov
  • Disclosed.ca (http://www.disclosed.ca/) – канадский проект по агрегации всех госконтрактов. Не самый методологически проработанный, но работающий. Создан НКО – Visible Government, которые также отдают все данные как открытые данные (https://github.com/visiblegovernment)
  • Government Expenses (http://www.governmentexpenses.ca/) ещё один канадский проект визуализирующий бюджет. Тоже не забывают об открытых данных.
  • РосЗатраты (http://www.rosspending.ru) – российский проект созданный по заказу ИНСОРа.

Итого:

1. Всегда контроль госрасходов идет с акцентом на открытые данные. Их создание или их использование.

2. Главные акценты – доступность информации, разъяснения, сравнения, анализ.

3. Предельные выводы по перерасходу средств и другим нарушениям делаются только после детального анализа и публикации разъяснений. С обязательными оговорками что это предположения (пример, zIndex).

4. Ни один из проектов не является «политическим», вокруг них вообще нет PR и серьёзного внимания СМИ.

А вот то чего нехватает в России в части публичного мониторинга госрасходов так это мониторинг за ФЦП и другими госпрограммами и визуализация бюджетов.

Originally published at Иван Бегтин. You can comment here or there.

О проектах по контролю за госрасходами в Мире
16 мая 11 11:40

Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:

Частные и некоммерческие проекты:

  • AidData (http://aiddata.org) – собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в виде базы PLAID, также доступной у них на сайте. У проект сильная методология сведения очень разнородных данных и сейчас они реализуют важную и сложную задачу геокодирования мест помощи, отмечая их на картах стран где идут международные программы.
  • Where Does Our Money Go (http://wheredoesmymoneygo.org/) – проект Open Knowledge Foundation (http://www.okfn.org), одного из наиболее заметных центров компетенции по открытым данным. В этом проекте собраны данных о бюджете Великобритании, Италии, Израиля, Германии и многих других стран. Много инфографики, в основном по Великобритании, и конечно доступность всего как открытых данных. А также материалы по их подходу к анализу госрасходов здесь – http://wiki.openspending.org
  • ClearSpending (http://sunlightfoundation.com/clearspending/) проект Sunlight Labs, одного из сильнейших центров компетенции по открытости государства и открытым данным в США. Они пошли по пути анализа качества раскрываемых данных и произвели детальный анализ соответствия раскрываемых данных по госзаказу и бюджетам ведомств. У них качественно поставлена методология и визуализация устройства бюджетного процесса – http://sunlightfoundation.com/clearspending/animation/
  • zIndex (http://www.zindex.cz/) – чешский проект активистов по мониторингу госзаказа. Они чем-то отдаленно похожи на Роспил.инфо, но без политического пиара. Каждый конкурс детально разбирается и преподается весьма детально и понятно. Почитайте его Wiki – http://wiki.zindex.cz и все станет на свои места. Да, материалы там на чешском так что лучше воспользоваться сервисами вроде Google Translate.
  • FedSpending (http://www.fedspending.org/) – проект по мониторингу госконтрактов в США. Один из первых подобных проектов в мире и именно он стал основой будущего правительственного проекта UsaSpending.gov
  • Disclosed.ca (http://www.disclosed.ca/) – канадский проект по агрегации всех госконтрактов. Не самый методологически проработанный, но работающий. Создан НКО – Visible Government, которые также отдают все данные как открытые данные (https://github.com/visiblegovernment)
  • Government Expenses (http://www.governmentexpenses.ca/) ещё один канадский проект визуализирующий бюджет. Тоже не забывают об открытых данных.
  • РосЗатраты (http://www.rosspending.ru) – российский проект созданный по заказу ИНСОРа.

Итого:

1. Всегда контроль госрасходов идет с акцентом на открытые данные. Их создание или их использование.

2. Главные акценты – доступность информации, разъяснения, сравнения, анализ.

3. Предельные выводы по перерасходу средств и другим нарушениям делаются только после детального анализа и публикации разъяснений. С обязательными оговорками что это предположения (пример, zIndex).

4. Ни один из проектов не является «политическим», вокруг них вообще нет PR и серьёзного внимания СМИ.

А вот то чего нехватает в России в части публичного мониторинга госрасходов так это мониторинг за ФЦП и другими госпрограммами и визуализация бюджетов.

Originally published at Иван Бегтин. You can comment here or there.

О том как создаются и финансируются общественные проекты в области e-Government
15 мая 11 03:37

На ХабраХабр новая статья о том как создаются и финансируются общественные/гражданские проекты – http://habrahabr.ru/blogs/e_gov/119282/

Originally published at Иван Бегтин. You can comment here or there.

Премьер-министр Великобритании Дэвид Кэмерон о Data.gov.uk
14 мая 11 09:00

Новость хоть и запоздалая, но любопытная.
Про то как развиваются открытые данные в мире и Великобритании в частности

В ноябре 2010 года Дэвид Кемерон выступил на тему публичности государства и доступа к информации. В частности, он рассказывал про раскрытие информации о расходах и про «право на данные».

Вот само видео

Это, безусловно, показатель того что в Великобритании уже сформировался понимание необходимости открытости в обществе и благодаря этому политики начинаю аппелировать к открытости данных как части их политических инициатив.

Это просто как ещё один пример разницы в подходе в текущих лидерах по открытости данных и большинство отстающих стран.

Обратите также внимание на упоминание коммерческого использования данных. Собственно недискриминационный доступ коммерческих структур к госинформации которая может быть использована в коммерческих целях – это важная часть открытости государства.

Originally published at Иван Бегтин. You can comment here or there.

Премьер-министр Великобритании Дэвид Кэмерон о Data.gov.uk
14 мая 11 09:00

Новость хоть и запоздалая, но любопытная.
Про то как развиваются открытые данные в мире и Великобритании в частности

В ноябре 2010 года Дэвид Кемерон выступил на тему публичности государства и доступа к информации. В частности, он рассказывал про раскрытие информации о расходах и про «право на данные».

Вот само видео

Это, безусловно, показатель того что в Великобритании уже сформировался понимание необходимости открытости в обществе и благодаря этому политики начинаю аппелировать к открытости данных как части их политических инициатив.

Это просто как ещё один пример разницы в подходе в текущих лидерах по открытости данных и большинство отстающих стран.

Обратите также внимание на упоминание коммерческого использования данных. Собственно недискриминационный доступ коммерческих структур к госинформации которая может быть использована в коммерческих целях – это важная часть открытости государства.

Originally published at Иван Бегтин. You can comment here or there.

Презентации по использованию открытых данных в Европе (SharePSI)
14 мая 11 08:08

В Европе 10 мая прошло мероприятие под названием SharePSI Workshop – демонстрация результатов создания проектов по использованию открытых данных коммерческим сектором и для гражданских проектов.

Мероприятие весьма любопытное, особенно интересное тем что оно сосредоточено именно вокруг _коммерческого_ использования открытых данных и нормальности этого процесса. Европейский подход, в принципе, выделяется тем что они выносят на обсуждения вопросы недискриминационного доступа к информации. В некоторых случаях данные полностью открыты и общедоступны, под лицензиями разрешающими коммерческое использование, в других случаях обеспечивается раскрытие информации за деньги, но по прозрачным схемам, когда доступ к информации имеет не одна организация монополист, а многие организации и доступ изначально правильно описан и цены на него определены.

Из интересного.

Презентация EuAlert – это сервис мониторинга госзакупок в Европе. Поскольку в Евросоюзе единого портала по госзакупкам нет и создание его весьма осложнено, то в этой области активно действуют коммерческие компании вроде EuAlert которые собирают открытые данные о закупках и сводят воедино. Заодно посмотрите на цифры в презентации.

http://www.slideshare.net/epsiplatform/euroalert

Fearsquare - о маппинге преступности на карты

Geo Product Finder

Primet – о недискриминационном доступе к метеорологической информации.

http://www.slideshare.net/epsiplatform/primet

Originally published at Иван Бегтин. You can comment here or there.

На Аль Джазире про Навального
13 мая 11 05:49

Телеканал Al Jazeera попросил меня выразить свое мнение по поводу деятельности А. Навального и его небезызвестного проекта.

Поскольку я своего мнения никогда не скрывал, то и озвучал ровно то что думаю. Вы можете посмотреть эпизод в записи здесь http://stream.aljazeera.com/episode/3804

Originally published at Иван Бегтин. You can comment here or there.

Верховный суд и наше право на свободу доступа к информации
12 мая 11 02:39

Евгений Альтовский (ЖЖ – ifap_ru) написал на очень важную тему – рассмотрение судами дел отказ в исполнении запросов на доступ к информации госорганов со стороны граждан и некоммерческих организаций.

Вот сама тема – http://ifap-ru.livejournal.com/261449.html где весьма подробно рассказывается о том как рассматриваются запросы на открытие данных госорганами (Министерством культуры и Роспечатью) и как эти отказы потом обжалуются.

В отличии от открытых данных, конечно, это не самая технологическая история. Это история принципиальной возможности получения информации от государственных структур. А также вопрос о нечеткости формулировок законов поволяющих чиновникам интерпретировать их в свою пользу во всех случаях когда это необходимо.

Фактически, все эти трактовки приводят к тому что 8-ФЗ в России, это далеко не Freedom of Information Act и его исполнение в России более чем слабое.

Кстати, до сих пор многие сайты органов власти ему не соответствуют, в том числе и федеральных. Сам закон чрезмерно детализирован в одних пунктах и непроработан в других.

И многое другое.

Собственно свобода доступа информации – это то что идет даже раньше открытых данных. Это фундамент для фундамента.

Originally published at Иван Бегтин. You can comment here or there.

По поводу нового портала Госуслуг
12 мая 11 12:26

Я так понимаю скоро основным порталом Госуслуг будет вот это – http://epgu.gosuslugi.ru/pgu/

Отличная штука. Вообще просто суперская. Я пока его разглядывал у меня созрела идея. Надо забахать проект, может быть даже и стартап с конкурсами а ля «сколько пакостей можно на сайте найти» и рейтинговать.

Идея такая – выбирается сайт, устанавливается приз и срок – примерно 1-2 дня. Каждый из записавшихся участников активно отсматривает веб-сайт на предмет всякой пакости, заполняет отчет куда вписывает все что он нашел – отсутствие «условий использования», кошмарные цвета, ограничения браузеров и так далее.

Потом ещё 3 дня остальные пользователи читают и голосуют за лучший обзор.  Тот кто наберет больше баллов получает приз. Приз можно сразу материальный, а можно в виде баллов по которым потом награждать самых успешных активистов. Это такая соц. сеть/сообщество ревьюверов.

По моему супер идея, как думаете?

К чему я это все. Этот портал, нет, не кошмарен конечно. Но очень неаппетитен. Если его разработчики ещё не состоят в «секте пользователенавистников», то им самое оно создать свое локальное её отделение. Составлять списки «гадостей» и «антиудобств». В самом то деле, неча пользователя расслаблять.

А это, кстати, вторая идея. Может быть даже кем-то воплощенная уже. Портальчик такой с рейтингами посвящённый ненависти к пользователям. С рейтингом самых лучших примеров такой ненависти воплощений.

Серьёзно по поводу этого портала я тоже напишу. Но тогда мягкими формулировками из этого поста уже не получится обойтись.

Originally published at Иван Бегтин. You can comment here or there.

Электоральная статистика. Теперь открытые данные
11 мая 11 11:01

Некоммерческая организация ГОЛОС по мониторингу выборов в России буквально вот только что открыла сайт электоральной статистики в нашей стране – stat.golos.org

Всего в их базе 36 834 записи о выборах на всех уровнях власти – от федерального до местного самоуправления, по всем регионам и начиная с 2003 года.

Огромный объем работы наконец-то доступный онлайн.

Но ещё важнее то что данные доступны именно как открытые данные. И у каждого из выборов есть ссылка на CSV файл с описанием.  Который можно выгрузить, загрузить в Excel

Скриншот главной страницы:

Там не все пока ещё идеально. На мой взгляд нехватает полного списка выборов в CSV, тех же данных в XML, нет описания CSV, но все это рабочие вопросы которые, как я уверен, разработчики решат сравнительно быстро.

Гораздо важнее что такие проекты появляются. Что открытые данные идут в умы людей. И то что некоммерческие организации начинают опережать органы власти в прозрачности.

А я сейчас думаю как эти данные можно было бы использовать для общего блага и пользы. Если у Вас есть какие-либо идеи, предложения или желания приложить силы – предлагаю думать вместе.

Originally published at Иван Бегтин. You can comment here or there.

Битва за Интернет
10 мая 11 03:56

Всячески рекомендую статью на PirateMedia и всю цепочку ссылок до первоисточника

http://piratemedia.ru/news/technology/internet/item/2370-the-pirate-bay-so-dnya-na-den-nachnyotsya-bitva-za-internet.html

и её оригинал на английском http://torrentfreak.com/the-pirate-bay-the-battle-of-internets-is-about-to-begin-110509/

и публикацию в The Telegraph http://www.telegraph.co.uk/technology/news/8481330/Alarm-over-EU-Great-Firewall-proposal.html

а вот и он, первоисточник – http://register.consilium.europa.eu/pdf/en/11/st07/st07181.en11.pdf

Собственно там на 4-й странице
The Presidency of the LEWP presented its intention to propose concrete measures towards creating
a single secure European cyberspace with a certain «virtual Schengen border» and «virtual access
points» whereby the Internet Service Providers (ISP) would block illicit contents on the basis of the
EU «black-list»
А жизнь то все интересней и интересней!

Originally published at Иван Бегтин. You can comment here or there.

Проекты по «полезности депутатов» в мире
10 мая 11 02:47

Оказывается тема гражданского контроля за политиками и депутатами активно прогрессирует и распространяется. Причем в весьма специфической форме – «меньше политики, больше демократии». Иначе говоря, граждане не особо доверяют политическим партиям, зато хотят точно знать что из себя представляют лично те люди за которых они голосовали.

И вот несколько проектов в примеры.

1. KohoVolit

Ссылка: http://kohovolit.eu/

Чешский проект по мониторингу деятельности депутатов Чехии, Словакии и Европарламента.

На скриншоте страница по депутатам чешского парламента – http://cs.kohovolit.eu/cz/psp/analysis/prehled-aktivity-poslancu_2010

Создатели сайта взяли данные с сайта чешского парламента – http://psp.cz/ и других ресурсов и разобрали их. А поскольку у них там публикуются подробные данные о поименных голосованиях и не только, то они подсчитали сколько раз депутат вообще голосовал. И оказалось что есть как те кто голосовал практически всегда, так и те кто ходил меньше чем на четверть голосований.

Вообще сайт стоит посмотреть на предмет множества разумных идей.

2. DoTankoch

Ссылка: http://dotankoch.sk/

Словацкий проект по мониторингу деятельности политиков. Не удивлюсь если как-то связанный с предыдущим. Также подсчитывается кто и как голосовал, а также возраст, образование и другие критерии оценки.

Страница с профилем депутата Anna Vittekova http://dotankoch.sk/poslanci/anna-vittekova/obdobie/5

3. Congreso Abierto

Ссылка: http://www.congresoabierto.com

Испанский шутливый проект по «битвам депутатов». На фотографии каких-либо прикольных деятелей накладываются лица депутатов и между ними имитируется битва с подсчетом победителя. На самом деле там сравниваются 2 депутата по множеству признаков таких как публичные выступления и высказывания.

Ссылка на битву между парой депутатов http://www.congresoabierto.com/#/fight/135/316

—-

Так что, к вопросу о критериях оценки деятельности. Все таки поименное голосование – это важный критерий оценки. Также как и факт физического присутствия депутата на голосовании. Будь эти данные публичны у наших федерального собрания и региональных парламентов, то можно было бы сделать проект не хуже.

Originally published at Иван Бегтин. You can comment here or there.

Про новый список госуслуг
04 мая 11 03:31

Как многие из вас знают появился перечень госуслуг переводимых в электронный вид, его можно посмотреть, например, на сайте Минкомсвязи тут http://minsvyaz.ru/common/upload/perechen.pdf

Прежде чем написать про этот перечень подробнее, сделаю отступление. Обычно когда я пишу тексты я пишу их простым живым русским языком. А когда напишу, то приступаю к чистке и вымарыванию матерных выражений. Иногда абзацами приходится вырезать, но что уж тут поделаешь – если буду матерится в каждом посте то совсем «не формат» получится.

В этом посте мне пришлось вырезать большую часть текста и найти в себе силы и волю написать что я думаю приличным языком. Это было непросто. Так что на этой героической ноте начну свой разбор этого перечня.

Для начала, общая и ключевая проблема – огромное число услуг озаглавленных как «предоставление информации». Дело в том что там под «предоставлением информации» упоминаются как то что может быть услугой, а то есть публикация информации которая может потребовать верификации данных заявителей, проверки его права на получение подобной информации или же получение информации которое содержит персональные данные заявителя, но также там очень много «государственных услуг» услугами не являющимися, а описывающих предоставление информации которая может и должна быть общедоступной и ни коим образом не регулироваться для так называемого регламентированного доступа. Иначе говоря, тем самым «государственные услуги» на предоставление информации вместо полного её раскрытия органичивают, а не обеспечивают доступность информации для граждан.

Подробнее по списку госуслуг:

Образование

</p>
1. Предоставление информации о реализации программ основного общего
и  среднего  (полного)  общего  образования,  а  также     дополнительных
общеобразовательных программ.
2.  Предоставление  информации  о  реализации  программ    основного
среднего  профессионального   образования,   а   также     дополнительных
профессиональных образовательных программ.
</p>

5. Предоставление информации об образовательных программах и учебных
планах,  рабочих  программах  учебных  курсов,  предметах,    дисциплинах
(модулях), годовых календарных учебных графиках.
6. Предоставление информации о порядке  проведения   государственной
(итоговой) аттестации обучающихся, освоивших основные  и   дополнительные
общеобразовательные  (за  исключением  дошкольных)  и    профессиональные
образовательные программы

Что это: Во всех случаях отсутствуют персональные данные. Нет ни единого намека на то что эта информация может быть ограниченного доступа.
Резюме: это не госуслуги. Доступ к информации должен регулироваться законодательством о раскрытии информации, но не государственными услугами.

3.  Предоставление  информации  о  результатах  сданных   экзаменов,
результатах тестирования и  иных  вступительных  испытаний,  а    также о
зачислении в федеральное государственное образовательное учреждение.

4. Предоставление  информации  о  текущей  успеваемости   учащегося,

</p>
ведение дневника и журнала успеваемости.
7.  Предоставление  информации  из  федеральной  базы       данных о
результатах единого государственного экзамена.

Что это: В данном случае присутствуют персональные данные об учащихся и не регламентировано не только предоставление услуги, но и идентификация возможных получателей услуги. В частности имеет ли право любой гражданин узнать об успеваемости любого ученика или же эту информацию могут получить лишь ограниченное число граждан, например, его родители, он сам и/или журналисты.
Резюме: в данных госуслугах присутствуют персональные данные и здесь вопрос регламентации не только доступности, но и недоступности данных что не отражено в постановлении правительства.

Здравоохранение

8. Прием заявок на дополнительное стационарное обследование и (или)
лечение  в  федеральном  государственном  учреждении     здравоохранения,
осуществляемые в целях направления пациента
на лечение за пределами территории Российской Федерации.
Может быть госуслугой

9. Предоставление информации из федерального банка данных  на   лиц,
пострадавших от радиационного воздействия и  подвергшихся   радиационному
облучению в результате чернобыльской и других радиационных  катастроф   и
инцидентов.
Резюме: Включает персональные данные о данных. лицах Кроме регламента предоставления услуги необходим и регламент ограничения в предоставлении подобной информации

10. Предоставление информации о порядке оказания специализированной
медицинской   помощи   в   федеральном   государственном       учреждении
здравоохранения.
Это _не_ госулуга. Информация должна публиковаться на сайте Минздравсоцразвития или самого ФГУЗ.

11. Выдача направления на госпитализацию в  стационарное   отделение
специализированного    федерального    государственного        учреждения
здравоохранения.
Да, может быть госуслугой

12. Оформление заявки на оказание  высокотехнологичной   медицинской
помощи  и  внесение  данных  заявителя   в   лист       ожидания оказания
высокотехнологичной  медицинской  помощи  федеральным     государственным
учреждением здравоохранения.
Да, может быть госуслугой
13. Выдача гражданам направлений на  прохождение   медико-социальной
экспертизы.
Да, может быть госуслугой
14.  Прием  заявок  (запись)  на  прием  к  врачу  в     федеральном
государственном учреждении здравоохранения.
Да, может быть госуслугой

Культура

15. Предоставление доступа к библиографической информации   сводного

электронного каталога библиотек России.

16. Предоставление библиографической информации из   государственных

библиотечных фондов, в том числе в части, не касающейся авторских прав.

Это НЕ госуслуги. Эта информация должна быть общедоступной.

—-

Архивный фонд

17. Прием заявок (запросов) федеральными государственными   архивами

на предоставление  архивных  документов  (архивных  справок,    выписок и

копий).

Да, может быть госуслугой.

—————–

и так далее. Разбирать все я не буду, но думаю что и так понятно что к чему.



Originally published at Иван Бегтин. You can comment here or there.

Сети влияния. Influence Networks.
04 мая 11 11:26

Оказывается совсем недавно, в апреле этого года несколько французских и германских организаций – ZeitOnline,  OWNI, OBSWeb, а также Transparency International запустили онлайн проект «Сети влияния» (Influence Networks) где реализовали ровно ту самую идею о которой я писал о проекте Госсвязи, а то есть сбор информации о связях между ключевыми государственными и корпоративными персонами и наглядное визуальное представление этой информации. В некоторых закрытых/полузакрытых проектах эта идея также реализована и используется аналитиками, но публичных проектов было мало, если вообще были.

И вот пример такого проекта – http://influencenetworks.org/

Его можно увидеть на скриншоте, а посмотреть на сайте.

Скажу честно, мне не очень нравится интерфейс, на мой взгляд онтология отношений там кое-где упрощена или, наоборот, усложнена.

Но, есть ряд возможностей которые не отметить нельзя:

1. Открытый исходный код под лицензией MIT – https://github.com/Pirhoo/Influence-Networks/

2. Совершенно правильный подход что любое «отношение» между персонами или персоной и организацией должны сопровождаться ссылкой на источник информации

3. Они загрузили туда большую базу по связям персона-организация из Freebase (и из Википедии через Freebase)

Вот некоторые примеры:

- Джордж Буш - http://influencenetworks.org/?screen=relation-visualise&rel=/en/george_w_bush|&trust_rank=3

- Владимир Путин – http://influencenetworks.org/?screen=relation-visualise&rel=/en/vladimir_putin|&trust_rank=3

- Барак Обама – http://influencenetworks.org/?screen=relation-visualise&rel=/en/barack_obama|&trust_rank=3

и так далее.

Originally published at Иван Бегтин. You can comment here or there.

Ссылки на 03.05.2011. Малоизвестные госсайты
03 мая 11 02:43

Originally published at Иван Бегтин. You can comment here or there.

This Blog

Tags

Archives

Syndication