Показатели для статистики - nextgis/skoroproverka GitHub Wiki
Перечень показателей для статистики по государственным проверкам за 2014 год.
Всего проверяемых организаций (TOTORG)
Формула: количество уникальных OGRN
Тип: одна цифра
Препроцессинг: не требуется
Статус: сделано
Всего проверок (TOTCHECK)
Формула: количество записей в исходном файле. Больше чем организаций, так как у одной организации может проверяться несколько подразделений.
Тип: одна цифра
Препроцессинг: не требуется
Статус: сделано
Организации проверяемые больше 10 раз (MOSTCHECKED)
Формула: Частотная таблица ОГРН, выборка частот >10, извлечение идентификаторов положения отобранных ОГРН в общей таблице и извлечение по ним названий организаций.
Тип: таблица - название организации, количество проверок, ОГРН
Препроцессинг: не требуется
Статус: сделано
Распределение по месяцам (MONTH)
Тип: барплот
Препроцессинг: превратить названия месяцев в их порядковые номера
Статус: сделано
Распределение по годам регистрации юр.лиц (YEARREG)
Тип: барплот
Препроцессинг: отделить год в отдельную колонку
Статус: сделано
Распределение по цели проведения проверки (GOAL)
Тип: барплот, таблица с количествами и процентами от общего
Препроцессинг: составить список ключевых слов и искать их в поле GOAL, возможно отбросить цели с незначительными количествами.
Статус: сделано (барплот), не сделано (таблица)
Распределение по типу юрлица (TYPE)
Тип: пирог
Препроцессинг: извлечь тип юрлица из названия, используя набор ключевых слов
Статус: сделано (барплот)
Распределение по форме (FORM)
Тип: барплот
Препроцессинг: разделить ОГРН на коды физлиц и юрлиц
Статус: сделано
Распределение по региону регистрации (OGRNREG)
Препроцессинг: извлечь регион из ОГРН (4,5 цифры)
Тип: карта
Статус: сделано
Распределение по году внесения записи в государственный реестр (YEAROGRN)
Препроцессинг: извлечь год внесения записи из кода ОГРН (2,3 цифры)
Тип: барплот
Статус: не сделано