Add new CLI command for file name extraction and hash generation
- Implemented `get_filenames` command in `batch_extractor.py` to extract file names from a specified directory and generate a dated hash for each file. - Updated README.md with instructions for using the new command. - Enhanced PDF generation in `build_pdf.py` by modifying file naming conventions to include article and size. - Added example PowerShell script for batch processing tasks. - Introduced new example Excel file for user reference.
This commit is contained in:
21
README.md
21
README.md
@@ -32,6 +32,27 @@ pip install -r requirements.txt
|
||||
|
||||
Процесс разделен на три простых шага в терминале:
|
||||
|
||||
### ШАГ 0: Подготовить пакетнйы скрипт, если файлов больше чем 1.
|
||||
|
||||
Нужно сохранить все файлы с КМ в одну папку.
|
||||
|
||||
потом запустить команду, которая достанет имена файлов из этой директории:
|
||||
|
||||
```bash
|
||||
python batch_extractor.py get-filenames "C:\путь\к\архиву\" "C:\путь\к\временным файлам\filenames.xlsx"
|
||||
```
|
||||
|
||||
эта команда создаст файл структуры Префикс/Имя файла
|
||||
|
||||
затем надо открыть файл filenames_exaple.xlsx из папки resources и дополнить созданный файл формулами, которые создадут полную питон команду для экстракции КМ
|
||||
|
||||
Затем открыть файл resources\run_task_example.ps1 - и вставить в него получившиеся команды
|
||||
|
||||
### Важно!! Обратить внимание на тип файла, для pdf надо использовать команду from-pdf и аналогично для zip. Кроме того, обязательно надо заменить путь к файлам (он забит в формуле)
|
||||
|
||||
потом можно запустить скрипт пакетной обработки.
|
||||
|
||||
|
||||
### ШАГ 1: Извлечение кодов в Excel (Создание списка КМ)
|
||||
|
||||
Возьмите файл, который вы скачали из системы «Честный ЗНАК», и натравите на него утилиту-экстрактор.
|
||||
|
||||
Reference in New Issue
Block a user