Documentation — _KsrfParser.py - robot-lab/judyst-link-analysis GitHub Wiki
class KsrfParser
- Парсит данные с сайта ksrf.ru.
get_rough_links
- Начальная обработка постановлений.
Объявление
def get_rough_links(cls, header: Header, sentenceMatchObjects: list)
Параметры
- header — представление класса
models.Header
- sentenceMatchObjects — объекты сопоставления предложений.
Возвращает
{header: roughLinks}
get_clean_links
- Конечная обработка ссылок на постановления.
Объявление
def get_clean_links( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str)
Параметры
- collected_links — словарь со списком представления класса
RoughLink
как элемент и представление классаHeader
как ключ. - court_site_content — словарь с представлением класса
DocumentHeader
как элемент и строкой uid как ключ. - courtPrefix — префикс суда.
Возвращает
Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]]
— обработанные ссылки на постановления.
get_clean_links2
- Конечная обработка ссылок на постановления.
Объявление
def get_clean_links2( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str)
Параметры
- collected_links — словарь со списком представления класса
RoughLink
как элемент и представление классаHeader
как ключ. - court_site_content — словарь с представлением класса
DocumentHeader
как элемент и строкой uid как ключ. - courtPrefix — префикс суда.
Возвращает
Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]]
— обработанные ссылки на постановления.
parse
- Процесс парсинга данных с сайта.
Объявление
def parse( cls, header: Header, sentenceMatchObjects: list, headersBase: Dict[str, Header], supertype: str headersForCheckingLinks: dict[datetime.date,dict[str,str]]) -> Dict[Header, CleanLink]
Параметры
- header — представление класса
models.Header
; - sentenceMatchObjects — объекты сопоставления предложений;
- headersBase — база заголовков;
- supertype — супертип;
- headersForCheckingLinks — словарь заголовков для проверяемых ссылок.
Возвращает
1.cleanLinks: Dict[Header, CleanLink]
— словарь с обработанными ссылками на постановления.