Diff: debug:


SAVE

SubCmpAlgo v1.1, by TheDoctorTeam!

Для изначальной загрузки субтитров в программу, воспользуйтесь интерфейсом сверху:

Форма открытия файла позволяет выбрать сами файлы субтитров для добавления, она принимает сразу несколько файлов. Также, вы можете вставить содержимое файла субтитров в поле справа от кнопки «Add», но только по одному за раз.

Чтобы, собственно, принять выбранные файлы или вставленный в поле текст, нажмите «Add». Субтитры попадут в список, где в квадратных скобках показывается количество распознанных реплик в них. Пополнять список можно многократно.

Запуск основного алгоритма сравнения производится кнопкой «Compare». Целесообразно обрабатывать примерно 2-5 файлов. Вы получите интерактивную таблицу.

Кнопка «Reset» очищает список загруженных субфайлов, не удаляя таблицу; для полной очистки нажмите «Compare» сразу после.

Флажок «Debug» включает отображение разбиения реплик линиями. Значения цветов: красный: начала фраз, синий – концы; голубой – файлы, белый – разбиения на блоки по паузам и относительный сдвиг по ним, чёрный – малое смещение; жёлтый – отвергнутые группой разбиения, зелёный – используемые разбиения.

Работа с таблицей заключается в выборе лидирующей реплики в каждой строке. Один щелчок по ячейке – её выбор, тогда она станет зелёной, а соседние – красными. Для отмены выбора щёлкните её снова, тогда вся строка опять станет жёлтой. Текущее количество лидирующих ячеек для каждого столбца отображается в / … / в заголовке окна и под таблицей.


Для сохранения текущего состояния, включая саму таблицу, отладочную картину разбиения, и выбранные лидирующие ячейки – воспользуйтесь текстовым полем внизу. Щелчок в него вызовет сохранение всего в строку. Дождитесь выделения текста в поле, и скопируйте его себе.

Альтернативно, можете просто кликнуть ссылку «Save» левее, и сохранить предложенный файл.

Для загрузки, вставьте в это же текстовое поле ранее полученную строку и нажмите «Load». Либо – выберите ранее сохранённый файл через форму загрузки правее, дополнительно нажимать уже ничего не нужно.

Примечания:

– новые браузеры позволяют перетаскивать файлы сразу на компоненты выбора, вместо принудительного открытия через диалог.

– при выборе нескольких файлов, последовательность их загрузки может отличаться от ожидаемой; для полного контроля загружайте поштучно.

– загрузка некорректных файлов, особенно Save/Load, непременно нарушит работу программы…

– это оффлайновый локальный и статический одностраничный скрипт, все действия происходят в браузере.

– алгоритм будет работать достаточно долго, когда файлов больше трёх.

– работают форматы субтитров .ass и ещё какой-то, где можно, к примеру строку «
00:21:25,350|00:21:28,486|POP|[SIGHS]
». Кстати, такие реплики, заключенные в квадратные скобки – игнорируются алгоритмом, а все символы «¶» и концевые пробелы – удаляются, равно как и пустые строки.


Особый режим дословного сравнения субтитров:

Для активации, отметьте флажок «Diff» перед нажатием «Compare». Тогда таблица станет неинтерактивной, однако будет содержать пометки на словах, которые встречаются только в данной ячейке, и ни в одной другой в том же ряду.

Обрезается всё, кроме английских и русский букв, регистр приводится к верхнему. Каждое слово проверяется на наличие в каждом из оставшихся файлов (хотя обычно, сравнение запускается лишь для двух), и если оно не найдено на той же строке каждого – помечается красным.

Строки, не содержащие ни одного помеченного слова, закрашиваются зелёным, а остальные – жёлтым. Снятие флажка «Strict» позволяет ослабить проверку, разрешая каждому слову находится не обязательно в той же строке, но и в соседней – на одну раньше или позже.

Поскольку сравнение не сопоставляет сами слова, то две копии одного повторенного слова могут соответствовать лишь одному в другом файле. Поэтому алгоритм не столько ищёт одинаковые строки, сколько подсвечивает такие слова, которых в другом файле нет.