В планах есть создание того, то указано в названии топика.
Что должно уметь делать приложение:
1. Принимать pdf-, doc-/docx-, rtf-, xml-, xls-, csv-, html- файл произвольной структуры.
2. Строить на основании этой структуры таблицы с импортированными данными
3. После изменения сгенерированной структуры таблицы пользователем корректно записать поля в базу данных с правильными типами и индексами по полям.
Что будет в входящих файлах.
В входящих файлах будут прайс-листы (или любые данные, содержащие прайс-листы) любых форм, размеров, структуры. С картинками и без, с любым количеством столбцов и строк, с таблицами неправильной структуры, когда в начале таблицы идет 10 столбцов, а потом, - остается 8 (они объединяются). Кроме того, - обязательно будет мусор в виде текста перед таблицей, лишних строк со справочными данными, картинками и баннерами (обычно в 1 строке или в заголовке прайса помещается фотография, логотип компании и т.д.).
Как обычно работают такие импорты? Такие импорты обычно работают с файлами определенной структуры. Моя же задача - создать приложение, которое от этой структуры будет независимо или зависимо самым минимальным образом (1 требование - файл должен содержать таблицу).
1. Вопрос: есть-ли близкое по духу решение, по уровню выше библиотек для работы с файлами указанных форматов?
2. Вопрос: встречал-ли интересные, красивые и удобные до слез счастья интерфейсы/библиотеки на JS-Jquery для визуализации работы с таблицами?
3. Вопрос. Какими библиотеками (в бэкенде) для работы с каждым форматом вы бы пользовались для решения данной задачи?
4. Сталкивался-ли кто-нибудь с волшебными демонами, приводящими любые файлы, допустим к xml структуре (которые смогли бы переварить даже такой файл, замусоренный лишними данными).
|