Благодарю за информацию. Насчет других букв пока не знаю. В той книге, которую распознал в Finereader 8 (пока что несколько страниц на пробу), "ять" скопировал в буфер обмена, вставил в "поиск и замена", он там правда скопировался, как квадратик, но заменился на "е". Эта книга 1883 года (наверное не очень старая), пока что других букв в ней не увидел.
А вообще да, в будущем надо будет в других книгах и другие буквы заменять.
Раз пишите, что i на конце слова редко бывает, тогда получается не надо такой вариант.
Вот примеры слов:
Бiенiе, страданiе
То есть, как понимаю, надо чтобы i определялась, как рядом стоящая с русскими буквами и в таких словах заменялась.
В тексте также названия медикаментов на иностранных языках, их не надо трогать.
У кого есть заготовка для обхода директорий с редактированием файлов в utf-8 без BOM, дайте пожалуйста. Сейчас хочу вставить в нее вот такую строку для замены двойных пустых строк на одинарные:
Имеются тексты, в которых есть по несколько пустых строк подряд (пробелы в них уже убрал). Подскажите как эти места заменить на одиночные пустые строки?
Пока что знаю один сервис Epn-AliExpress, там можно генерировать ссылку на категории товаров и сделав красочный рекламный банер, засовывать эту гиперссылку к нему. Вот по такому принципу наверное варианты надо использовать. SWF вставка требует наверное дорогого софта.
Пожалуйста подскажите, какая рекламная сеть позволяет вставить рекламу в PDF файлы (копии газетных статей, текст под сканом)? Может есть способы по вставке банеров Google Adsense в PDF?
Для программы Everything локального поиска по именам файлов http://www[dot]voidtools[dot]com/ надо регулярное выражение для поиска слова 1871. Нужно расставить пробелы спереди и сзади. Вот этот вариант не работает:
regex:\s1871\s
А там такая справка:
regex:
Операторы:
пробел AND ('и')
| OR ('или')
! NOT ('не')
< > Скобки
" " Найти точную фразу
Символы подстановки (шаблоны):
* Ноль или более символов
? Один символ
*. Имена файлов без расширения
*.* То же, что *
Макросы:
quot: Символ двойной кавычки (")
apos: Символ апострофа (')
amp: Символ амперсанда (&)
lt: Знак 'меньше' (<)
gt: Знак 'больше' (>)
#x: Юникодный символ с кодом x
Модификаторы:
ascii: Разрешить быстрое ASCII-сравнение регистров букв
case: Различать регистр букв
diacritics: Различать диакритические знаки
file: Только файлы
folder: Только папки
noascii: Запретить быстрое ASCII-сравнение регистров букв
nocase: Не различать регистр букв
nodiacritics: Не различать диакритические знаки
nofileonly: Не разрешать только файлы
nofolderonly: Не разрешать только папки
nopath: Не учитывать путь
noregex: Запретить регулярные выражения
nowfn: Отключить сопоставление только целых имён файлов
nowholefilename: Отключить сопоставление только целых имён файлов
nowholeword: Отключить сопоставление только целых слов
nowildcards: Запретить символы подстановки (шаблоны)
noww: Отключить сопоставление только целых слов
path: Сопоставлять путь и имя файла
regex: Разрешить регулярные выражения
utf8: Запретить быстрое ASCII-сравнение регистров букв
wfn: Сопоставлять только целые имена файлов
wholefilename: Сопоставлять только целые имена файлов
wholeword: Сопоставлять только целые слова
wildcards: Разрешить символы подстановки (шаблоны)
ww: Сопоставлять только целые слова
Функции:
attrib:<атрибуты> Найти файлы и папки с указанными файловыми атрибутами
attributes:<атрибуты> Найти файлы и папки с указанными файловыми атрибутами
child:<имя_файла> Найти папки, содержащие файл с подходящим именем
dateaccessed:<дата> Найти файлы и папки с указанной датой последнего доступа
datecreated:<дата> Найти файлы и папки с указанной датой создания
datemodified:<дата> Найти файлы и папки с указанной датой изменения
daterun:<дата> Найти файлы и папки с указанной датой запуска
da:<дата> Найти файлы и папки с указанной датой последнего доступа
dc:<дата> Найти файлы и папки с указанной датой создания
dm:<дата> Найти файлы и папки с указанной датой изменения
dr:<дата> Найти файлы и папки с указанной датой запуска
dupe: Найти дублирующиеся имена файлов
empty: Найти пустые папки
ext:<список> Найти файлы с подходящим расширением из указанного списка расширений, разделённых точкой с запятой (;)
fsi:<индекс> Найти файлы и папки в указанном внутреннем индексе файловой системы с базой 0
len:<длина> Найти файлы и папки с именами указанной длины
parents:<кол-во> Найти файлы и папки с указанным количеством родительских папок
rc:<дата> Найти файлы и папки с указанной датой последнего изменения
recentchange:<дата> Найти файлы и папки с указанной датой последнего изменения
root: Найти файлы и папки, не имеющие родительских папок
runcount:<число> Найти файлы и папки, запущенные указанное количество раз
size:<размер> Найти файлы указанного размера (в байтах)
type:<тип> Найти файлы и папки указанного типа
Синтаксис функций:
функция:значение Равно значению
функция:<=значение Меньше или равно значению
функция:<значение Меньше значения
функция:=значение Равно значению
функция:>значение Больше значения
функция:>=значение Больше или равно значению
функция:нач..кон Находится в диапазоне значений с начала до конца
функция:нач-кон Находится в диапазоне значений с начала до конца
Синтаксис размеров:
размер[kb|mb|gb]
Константы размеров:
empty
tiny 0 КБ < размер <= 10 КБ
small 10 КБ < размер <= 100 КБ
medium 100 КБ < размер <= 1 МБ
large 1 МБ < размер <= 16 МБ
huge 16 МБ < размер <= 128 МБ
gigantic размер > 128 МБ
unknown
Синтаксис дат:
год
месяц/год или год/месяц - в зависимости от региональных настроек
день/месяц/год, месяц/день/год или год/месяц/день - в зависимости от региональных настроек
Константы атрибутов:
A Готов для архивирования
C Сжатый
D Папка
E Зашифрованный
H Скрытый
I Содержимое не проиндексировано
L Точка повторной обработки
N Обычный
O Недоступный (offline)
P Разрежённый файл
R Только чтение
S Системный
T Временный
V Устройство
А к какому бесплатному редактору можно привязать русскоязычную справку? То есть выделяем ключевое слово, нажимаем комбинацию клавиш и справка открывается в нужном месте. Подобное реализовано в AutoIt.