обьединение нескольких списков фраз
|
|
galkin24 | Дата: Суббота, 17.03.2012, 22:32 | Сообщение # 1 |
Рядовой
Группа: Пользователи
Сообщений: 14
Статус: Offline
| лучше иметь один большой список фраз или несколько по категориям?
сейчас у меня сделано так : http://www.beluo.ru/instrukczii/367-nastrojka-dansguardian-pod-alt-linux-501-server-shkolnyj кроме этого есть список weighted_russian с этого сайта Мне так и оставить ? или обьединить?
|
|
| |
Vito | Дата: Суббота, 17.03.2012, 22:47 | Сообщение # 2 |
Подполковник
Группа: Администраторы
Сообщений: 131
Статус: Offline
| В веб-интерфейсе списки фраз ведутся раздельно по категория, так удобнее. Если вести списки фраз вручную, то лучше все русские фразы собрать в одном списке, поскольку уменьшается количество работы по обслуживанию списков. То есть, нужно ориентироваться на удобство обслуживания.
|
|
| |
galkin24 | Дата: Суббота, 17.03.2012, 22:52 | Сообщение # 3 |
Рядовой
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Спасибо! примерно так и собирался сделать, только смущает проверка двух списков ( каждый если не ошибаюсь свыше 12 страниц) на возможные совпадения
|
|
| |
Vito | Дата: Суббота, 17.03.2012, 23:49 | Сообщение # 4 |
Подполковник
Группа: Администраторы
Сообщений: 131
Статус: Offline
| Можете облегчить труд себе Делаете копию списков Открываете копию в любом юниксовом текстовом редакторе например Kate, Kwrite, Bluefish Заменяете на Импортируете файл как CSV в openoffice, сохраняете в родном формате офиса, далее просто сортируете по первому столбцу с расширением диапазон сортировки на все столбцы. В отсортированном виде уже легче просматривать на совпадения. И изменять. Потом просто экспортируйте в CSV, разделитель точка с запятой, для выделения текста не используйте никаких знаков, по умолчанию предлагаются кавычки. Заменяете в редакторе знак (точка с запятой) на отсутвие любого символа. Все файл списка готов, далее создаются две его копии в других кодировках.
|
|
| |
galkin24 | Дата: Воскресенье, 18.03.2012, 21:27 | Сообщение # 5 |
Рядовой
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Проделал я это. В принципе весьма быстро получилось. Но как всегда неприятные моменты был у меня список : 611 строчек в каждой из трёх кодировок. + список weighted_russian с этого сайта только в юникоде 734 фразы. После сегодняшнего обьединения получил по 1298 фраз в каждой из трёх кодировок. ... и появилась весьма заметная пауза в работе браузера. может 2 сек. но как то напрягает при работе нескольких машин будет наверное ещё хуже.
|
|
| |
Vito | Дата: Понедельник, 19.03.2012, 19:16 | Сообщение # 6 |
Подполковник
Группа: Администраторы
Сообщений: 131
Статус: Offline
| От много зависит: от компьютера, от количества фраз, от объема текста на странице,
Ускорить можно, отключив некоторые списки, типа китайских, японских и пр, конечно если не на границе живете:) Надо бы попробовать придумать и сделать тест, на котором можно было бы протестировать по скорости. Подумаем, так как оптимизация требуется во многих случаях, как на медленных, так и быстрых соединениях, а тест мог бы прояснить ситуацию.
Dansguardian грузит текст страницы полностью, после чего проверяет и отдает ее браузеру. Из-за больших объёмов современных страниц, вполне может быть указанная задержка.
|
|
| |