Add new CLI command for file name extraction and hash generation

- Implemented `get_filenames` command in `batch_extractor.py` to extract file names from a specified directory and generate a dated hash for each file.
- Updated README.md with instructions for using the new command.
- Enhanced PDF generation in `build_pdf.py` by modifying file naming conventions to include article and size.
- Added example PowerShell script for batch processing tasks.
- Introduced new example Excel file for user reference.
This commit is contained in:
2026-02-28 12:59:56 +03:00
parent 6850f3672e
commit 6a2c0d0d35
6 changed files with 104 additions and 15 deletions

View File

@@ -32,6 +32,27 @@ pip install -r requirements.txt
Процесс разделен на три простых шага в терминале:
### ШАГ 0: Подготовить пакетнйы скрипт, если файлов больше чем 1.
Нужно сохранить все файлы с КМ в одну папку.
потом запустить команду, которая достанет имена файлов из этой директории:
```bash
python batch_extractor.py get-filenames "C:\путь\к\архиву\" "C:\путь\к\временным файлам\filenames.xlsx"
```
эта команда создаст файл структуры Префикс/Имя файла
затем надо открыть файл filenames_exaple.xlsx из папки resources и дополнить созданный файл формулами, которые создадут полную питон команду для экстракции КМ
Затем открыть файл resources\run_task_example.ps1 - и вставить в него получившиеся команды
### Важно!! Обратить внимание на тип файла, для pdf надо использовать команду from-pdf и аналогично для zip. Кроме того, обязательно надо заменить путь к файлам (он забит в формуле)
потом можно запустить скрипт пакетной обработки.
### ШАГ 1: Извлечение кодов в Excel (Создание списка КМ)
Возьмите файл, который вы скачали из системы «Честный ЗНАК», и натравите на него утилиту-экстрактор.