Понедельник, 07.10.2024, 22:37
Dansguardian+ и не только
Главная Регистрация Вход
Приветствую Вас, Гость · RSS
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
обьединение нескольких списков фраз
galkin24Дата: Суббота, 17.03.2012, 22:32 | Сообщение # 1
Рядовой
Группа: Пользователи
Сообщений: 14
Репутация: 0
Статус: Offline
лучше иметь один большой список фраз или несколько по категориям?

сейчас у меня сделано так : http://www.beluo.ru/instrukczii/367-nastrojka-dansguardian-pod-alt-linux-501-server-shkolnyj
кроме этого есть список weighted_russian с этого сайта
Мне так и оставить ? или обьединить?
 
VitoДата: Суббота, 17.03.2012, 22:47 | Сообщение # 2
Подполковник
Группа: Администраторы
Сообщений: 131
Репутация: 2
Статус: Offline
В веб-интерфейсе списки фраз ведутся раздельно по категория, так удобнее.
Если вести списки фраз вручную, то лучше все русские фразы собрать в одном списке, поскольку уменьшается количество работы по обслуживанию списков.
То есть, нужно ориентироваться на удобство обслуживания.
 
galkin24Дата: Суббота, 17.03.2012, 22:52 | Сообщение # 3
Рядовой
Группа: Пользователи
Сообщений: 14
Репутация: 0
Статус: Offline
Спасибо! примерно так и собирался сделать, только смущает проверка двух списков ( каждый если не ошибаюсь свыше 12 страниц) на возможные совпадения
 
VitoДата: Суббота, 17.03.2012, 23:49 | Сообщение # 4
Подполковник
Группа: Администраторы
Сообщений: 131
Репутация: 2
Статус: Offline
Можете облегчить труд себе
Делаете копию списков
Открываете копию в любом юниксовом текстовом редакторе например Kate, Kwrite, Bluefish
Заменяете
Code
><
на
Code
>;<

Импортируете файл как CSV в openoffice, сохраняете в родном формате офиса, далее просто сортируете по первому столбцу с расширением диапазон сортировки на все столбцы.
В отсортированном виде уже легче просматривать на совпадения. И изменять.
Потом просто экспортируйте в CSV, разделитель точка с запятой, для выделения текста не используйте никаких знаков, по умолчанию предлагаются кавычки.
Заменяете в редакторе знак (точка с запятой) на отсутвие любого символа.
Все файл списка готов, далее создаются две его копии в других кодировках.
 
galkin24Дата: Воскресенье, 18.03.2012, 21:27 | Сообщение # 5
Рядовой
Группа: Пользователи
Сообщений: 14
Репутация: 0
Статус: Offline
Проделал я это. В принципе весьма быстро получилось. Но как всегда неприятные моменты cry
был у меня список : 611 строчек в каждой из трёх кодировок. + список weighted_russian с этого сайта только в юникоде 734 фразы.
После сегодняшнего обьединения получил по 1298 фраз в каждой из трёх кодировок.
... и появилась весьма заметная пауза в работе браузера. может 2 сек. но как то напрягает cry
при работе нескольких машин будет наверное ещё хуже.
 
VitoДата: Понедельник, 19.03.2012, 19:16 | Сообщение # 6
Подполковник
Группа: Администраторы
Сообщений: 131
Репутация: 2
Статус: Offline
От много зависит:
от компьютера,
от количества фраз,
от объема текста на странице,

Ускорить можно, отключив некоторые списки, типа китайских, японских и пр, конечно если не на границе живете:)
Надо бы попробовать придумать и сделать тест, на котором можно было бы протестировать по скорости.
Подумаем, так как оптимизация требуется во многих случаях, как на медленных, так и быстрых соединениях, а тест мог бы прояснить ситуацию.

Dansguardian грузит текст страницы полностью, после чего проверяет и отдает ее браузеру.
Из-за больших объёмов современных страниц, вполне может быть указанная задержка.
 
  • Страница 1 из 1
  • 1
Поиск:

Сайт управляется системой uCoz