Documentation — _CodeParsers.py - robot-lab/judyst-link-analysis GitHub Wiki
_get_next_dec_for_link_checking
Получение строк для проверки на наличие ссылок.
Объявление
def _get_next_dec_for_link_checking( stringNumber:int, filePath:str)
Параметры
stringNumber - номер строки в файле, по умолчанию = 1;
filePath - путь к файлу, по умолчанию = PATH_TO_JSON_HEADERS_FOR_CHECKING_LINKS_FILENAME=os.path.join('Decision files', 'ForCheckingLinksDecisionHeaders.jsonlines')
.
class _BaseCodeParser
Класс, описывающий нахождение и обработку ссылок из документов.
_init_patterns
Инициализация регулярных выражений для нахождения ссылок.
Объявление
Параметры
cls - представление класса.
get_rough_links
Получение ссылок первичной обработки.
Объявление
def get_rough_links( cls, header: Header, sentenceMatchObjects: list, findInOpinion: bool)
Параметры
cls - представление класса;
header — представление класса Header
;
sentenceMatchObjects — объекты сопоставления предложений;
findInOpinion — ищем ли в мнениях людей, по умолчанию = false.
Возвращает
List[RoughLink] — ссылки первичной обработки.
get_clean_links
Получение ссылок конечной обработки.
Объявление
def get_clean_links( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str, headersForCheckingLinks: dict[datetime.date,dict[str,str]])
Параметры
cls - представление класса;
collected_links — словарь со списком представления класса RoughLink
как элемент и представление класса Header
как ключ;
courtSiteContent — словарь с представлением класса Header
как элемент и строкой uid как ключ;
courtPrefix — префикс суда;
headersForCheckingLinks — словарь заголовков для проверяемых ссылок.
Возвращает
Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]] — ссылки конечной обработки.
parse
Получаем обработанные ссылки из файла.
Объявление
def parse( cls, header: Header, sentenceMatchObjects: list, headersBase: Dict[str, Header], supertype: str, headersForCheckingLinks: dict[datetime.date,dict[str,str]])
Параметры
cls - представление класса;
header — представление класса Header
;
sentenceMatchObjects — объекты сопоставления предложений;
headersBase — словарь с представлением класса Header
как элемент и строкой uid как ключ;
supertype — супертип;
headersForCheckingLinks — словарь заголовков для проверяемых ссылок.
Возвращает
Dict[Header, CleanLink] — словарь с обработанными ссылками.
KoaprfCodeParser(_BaseCodeParser)
Класс, описывающий регулярные выражения для парсинга Кодекса Российской Федерации об административных правонарушениях.
GkrfCodeParser(_BaseCodeParser)
Класс, описывающий регулярные выражения для парсинга Гражданского кодекса Российской Федерации.
NkrfCodeParser(_BaseCodeParser)
Класс, описывающий регулярные выражения для парсинга Налогового кодекса Российской Федерации.
UkrfCodeParser(_BaseCodeParser)
Класс, описывающий регулярные выражения для парсинга Уголовного кодекса Российской Федерации.
🗂️ Page Index for this GitHub Wiki