Pre 6×10
Надеюсь сегодня Сун и Джин обретут душевное спокойствие и равновесие.
А то единственное чем запоминается Сун (еще с конца пятого сезона) — это то, что она, как Майкл, пристаёт ко всем: «когда мы пойдем искать моего мужа?»
WAAAAAAAAAAAAAAAAAAAAAAAAALT!
Прозрачная связка squid и tor
Дома я кушаю web через squid. Потому что у меня туда и баннерорезка прикручена и прочие полезные штуковины.
Но для доступа на некоторые сайты пришлось поднять tor
А чтобы каждый раз не менять прокси в настройках бразуера tor можно прикрутить к squid
Как поставить и настройть squid и tor написано в куче других мест
А тут только конфиг:
# Создаем acl любым доступным способом. Я выбрал файл со списком доменов acl torhost dstdomain -i "/etc/squid/torhosts" # Немного параноидальной анонимности header_access UserAgent deny torhost header_access From deny torhost header_access Referer deny torhost # Магия # Родительский прокси на localhost:8118 таймаут 7 секунд cache_peer localhost parent 8118 7 no-query default # Пользоваться родительскими прокси разрешаем только torhost never_direct allow torhost # torhost разрешаем пользоваться только родительскими прокси always_direct deny torhost # Всем остальным разрешаем ходить напрямую always_direct allow all
Если используется больше чем один родительский прокси, то правила будут посложнее. Но я до этого додумаюсь, когда возникнет практическая необходимость.
Звук в телефоне вернулся также неожиданно как и пропал.
Я его конечно сделал хардресет, но тогда не помогло.
Единственное, что еще с ним происходило — ночь пролежал полностью выключенным. На утро с удивлением обнаружил, что он пищит.
... или нет :/
MTV Uncensored и MTV: Making a Revolution
Дальше по книжной полке.
Две книжки от тех романтических временах, когда MTV еще было музыкальным каналом. Трудно преставить, но такие времена были. Даже MTV Russian первые 5 лет были нормальным музыкальным каналом. Но ничто не вечно и о тех временах остались только воспоминания запечатленные в двух книжках.
И обоих книжек уже нет в печати.
Книжка номер раз: MTV: The Making of a Revolution // Tom McGrath, 1996

Эта книжка документальная. О создании первого музыкального кабельного канала. О том как все хотели MTV. О том как все были против MTV. О том появился четырнадцатиминутный Thriller. Как Video Killed the Radio Star. Как Dire Straits открывали MTV Europe со своим Money for Nothing (туда еще прокрался Sting, который тоже хотел своё MTV) и даже о президентских выборах 1992 года.
Это один из редких случаев, когда книжка обнаружилась в сети. Конечно в виде картинок. Так что я её напоил, накормил, почистил, распознал и сделал нормальный файл.
Книжка номер два: MTV Uncensored // MTV, 2002

Это — толстая фотокнига. Тут почти одни картинки. И немного текста. Вообще, я считаю, в наш век цифровых изданий, большие книги с картинками — это единственный вид книг, которые я готов покупать в бумаге. Но к сожалению не всё так хорошо с доступностью, поэтому покупать приходится больше.
Рассказывать тут нечего, зато я нащелкал фоток:
Celebrity deathmatch
iRiver Story
На ридере всего 8 цветов
Но он умеет dithering
А вот так выглядит цветная фотка
Вообще, мне нравятся как выглядят фотографии на нем. Есть какое-то интересное ощущение
Как сделать из PDF «нормальный» текст
По горячим следам.
Краткий список шагов.
Если PDF в виде картинки, то надо эти картинки вытащить
- xPDF или Some PDF Images
- Может случиться такая неприятность, что на каждой странице будут разрозненные изображения. Тогда надо отрендерить страницу полностью чем-то другим
Я в итоге воспользовался ghostscript
gswin32c.exe -dSAFER -dBATCH -dNOPAUSE -sDEVICE=png16m -r400 -sOutputFile=output%04d.png input.pdf
Вот такая комманда сделает из pdf файла отдельные png-картинки с качеством 400pdi - Тут дальше идет чистка по желанию, обрезка колонтитулов и прочее
Если у страниц разная степень заливки текстом, то иногда будет полезно наложить все страницы друг на друга, чтобы посмотреть где имено надо обрезать лишне.
Опять таки мне помог консольный ImageMagick
convert *.png -compose darken -flatten out.jpg
Если PDF с текстом, то можно попытаться его вытащить. Бесплатных программ найдено не было, но из платных Solid PDF Converter умеет всё и делает это отлично. Правда я заметил, что он плохо дружет с символами переноса, считая из дефисами. Да и с колонтитулами и прочим мусором придется разбираться отдельно.
Можно текстовый PDF перевести в картинки той же командой ghostscript и задача сводится к предыдущей.
Теперь FineReader. Если скан чистый и без колонтитулов, то задача очень проста. Следует только позаботиться о двух вещах:
- вручную выделить картинки (после того как он разобьет на блоки автоматом)
- блоки на страницах на которых есть колонки, надо выделить в порядке вниз-вправо, а то потом они перемешаются в неправильном порядке
FineReader 10 показывают удивительную точность распознования текста. На страницу из 300 книг было найден всего десяток неправильных символов (это то, что подсвечивает Word)
А теперь нам нужен OpenOffice. Не сколько он сам, а мега-плагин OOoFBTools.
Он нам нужен по двум причинам:
- Почистить текст (OOoFBTools -> Корректор текста)
- Разметить текст и сделать FB2 книгу
После установки плагина необходимо зайти в Файл->Шаблоны->Управление и загрузить файл шаблонов из архива с плагином.
Затем, OOoFBTools->Загрузка шаблона стилей в документ. F11

Получаем панель с основными стилями. Выделяем в тексте кусок, применяем подходящий стиль.
Стилями Livel* выделяются названия глав, разделов и прочего территориально-административного деления. Потом по этим данным будет создано оглавление.
Другие стили нужны для того, чтобы в книгочиталке (железной или программной) текст шел не сплошной волной, а отдельно были выделены вещи вроде эпиграфов, цитат и других полезных вещей.
Если скан хороший, то вся работа займет около полутора часов.
iRiver Story. Еще про PDF
У PDF есть еще одно нехорошое для нашего дела свойство, о котором стоит сказать отдельно от книжек-картинок и книжек-с-текстом.
Когда Adobe придумало PDF у них в мыслях была очень хорошая идея: PDF должен на любом устройстве выглядеть одинаково. Что они в итоге и сделали.
Но тогда никто и не подумывал о мобильных устройствах. А они в итоге появились и развились до такого уровня, что там тоже завелись книги.
И проблема встала в полный рост: PDF файл содержит не только текст, но и всё оформление, которое просто так из него не вырежешь. Поэтому смотреть на красивую, подготовленную к печfти книгу на маленьком экране не очень и получается.
Хотя iRiver и не пасует перед сложным форматированием (и даже шрифтами!) и даже видно буквы, но читать трудно.
Adobe тоже осознала глубину проблемы и в итоге родила технологию Reflow, которая позволяет убирать форматирование с PDF и показывать более-менее приличный текст.
«Более-менне» — это потому что иногда форматирование всё таки непобеждаемое и блоки текста оказываются в книге не в таком порядке как требуется. А если снять форматированние с предыдущей картинки, то там текст и картинки перемешаются в кашу и страницы разъедется. Хотя чаще всего результат всё равно приемлимый.
Как пишут в обзорах, у iRiver Story очень хорошая поддержка PDF. Вроде там даже родной Adobe-овский софт для этого дела и привинчен.
Ну и на сайте можно скачать Adobe Reader для мобильных платформ и Adobe Digital Editions для PC.
Но самый лучший, хотя и затратный по времени способ, — это распознать в FineReader и потом собрать книгу в нормальном формате.

