Generation LOST Time to get lost

31Мар/100

Changes — 2009 — Lament

Я редко добираюсь до нефолка, но вот этот альбом мне понравился

Связано с категорией: mp3 Нет комментариев
31Мар/100

Pre 6×10

Надеюсь сегодня Сун и Джин обретут душевное спокойствие и равновесие.

А то единственное чем запоминается Сун (еще с конца пятого сезона) — это то, что она, как Майкл, пристаёт ко всем: «когда мы пойдем искать моего мужа?»

WAAAAAAAAAAAAAAAAAAAAAAAAALT!

Связано с категорией: LOST Нет комментариев
30Мар/100

LOST 6×09

—Wanna know a secret?
Ричард дразнится

И не понятно, что добавить

Связано с категорией: LOST, СПГС Читать полностью
29Мар/100

Прозрачная связка squid и tor

Дома я кушаю web через squid. Потому что у меня туда и баннерорезка прикручена и прочие полезные штуковины.

Но для доступа на некоторые сайты пришлось поднять tor

А чтобы каждый раз не менять прокси в настройках бразуера tor можно прикрутить к squid

Как поставить и настройть squid и tor написано в куче других мест

А тут только конфиг:

 # Создаем acl любым доступным способом. Я выбрал файл со списком доменов
 acl torhost dstdomain -i "/etc/squid/torhosts"
 # Немного параноидальной анонимности
 header_access UserAgent deny torhost
 header_access From deny torhost
 header_access Referer deny torhost
 # Магия
 # Родительский прокси на localhost:8118 таймаут 7 секунд
 cache_peer localhost parent 8118 7 no-query default
 # Пользоваться родительскими прокси разрешаем только torhost
 never_direct allow torhost
 # torhost разрешаем пользоваться только родительскими прокси
 always_direct deny torhost
 # Всем остальным разрешаем ходить напрямую
 always_direct allow all

Если используется больше чем один родительский прокси, то правила будут посложнее. Но я до этого додумаюсь, когда возникнет практическая необходимость.

Связано с категорией: Linux Нет комментариев
29Мар/100

Звук в телефоне вернулся также неожиданно как и пропал.

Я его конечно сделал хардресет, но тогда не помогло.

Единственное, что  еще с ним происходило — ночь пролежал полностью выключенным. На утро с удивлением обнаружил, что он пищит.

... или нет :/

Связано с категорией: PDA Нет комментариев
29Мар/100

MTV Uncensored и MTV: Making a Revolution

Дальше по книжной полке.

Две книжки от тех романтических временах, когда MTV еще было музыкальным каналом. Трудно преставить, но такие времена были. Даже MTV Russian первые 5 лет были нормальным музыкальным каналом. Но ничто не вечно и о тех временах остались только воспоминания запечатленные в двух книжках.

И обоих книжек уже нет в печати.

Книжка номер раз: MTV: The Making of a Revolution // Tom McGrath, 1996

Эта книжка документальная. О создании первого музыкального кабельного канала. О том как все хотели MTV. О том как все были против MTV. О том появился четырнадцатиминутный Thriller. Как Video Killed the Radio Star. Как Dire Straits открывали MTV Europe со своим Money for Nothing (туда еще прокрался Sting, который тоже хотел своё MTV) и даже о президентских выборах 1992 года.

Это один из редких случаев, когда книжка обнаружилась в сети. Конечно в виде картинок. Так что я её напоил, накормил, почистил, распознал и сделал нормальный файл.

Книжка номер два: MTV Uncensored // MTV, 2002

Это — толстая фотокнига. Тут почти одни картинки. И немного текста. Вообще, я считаю, в наш век цифровых изданий, большие книги с картинками — это единственный вид книг, которые я готов покупать в бумаге. Но к сожалению не всё так хорошо с доступностью, поэтому покупать приходится больше.

Рассказывать тут нечего, зато я нащелкал фоток:

Celebrity deathmatch

Celebrity deathmatch

Связано с категорией: 80s, Amazon, Книги Читать полностью
29Мар/100

iRiver Story

На ридере всего 8 цветов

Но он умеет dithering

А вот так выглядит цветная фотка

Вообще, мне нравятся как выглядят фотографии на нем. Есть какое-то интересное ощущение

Связано с категорией: ebook Нет комментариев
28Мар/100

Как сделать из PDF «нормальный» текст

По горячим следам.

Краткий список шагов.

Если PDF в виде картинки, то надо эти картинки вытащить

  • xPDF или Some PDF Images
  • Может случиться такая неприятность, что на каждой странице будут разрозненные изображения. Тогда надо отрендерить страницу полностью чем-то другим
    Я в итоге воспользовался ghostscript
    gswin32c.exe -dSAFER -dBATCH -dNOPAUSE -sDEVICE=png16m -r400 -sOutputFile=output%04d.png input.pdf
    Вот такая комманда сделает из pdf файла отдельные png-картинки с качеством 400pdi
  • Тут дальше идет чистка по желанию, обрезка колонтитулов и прочее
    Если у страниц разная степень заливки текстом, то иногда будет полезно наложить все страницы друг на друга, чтобы посмотреть где имено надо обрезать лишне.
    Опять таки мне помог консольный ImageMagick
    convert *.png -compose darken -flatten out.jpg

Если PDF с текстом, то можно попытаться его вытащить. Бесплатных программ найдено не было, но из платных Solid PDF Converter умеет всё и делает это отлично. Правда я заметил, что он плохо дружет с символами переноса, считая из дефисами. Да и с колонтитулами и прочим мусором придется разбираться отдельно.

Можно текстовый PDF перевести в картинки той же командой ghostscript и задача сводится к предыдущей.

Теперь FineReader. Если скан чистый и без колонтитулов, то задача очень проста. Следует только позаботиться о двух вещах:

  • вручную выделить картинки (после того как он разобьет на блоки автоматом)
  • блоки на страницах на которых есть колонки, надо  выделить в порядке вниз-вправо, а то потом они перемешаются в неправильном порядке

FineReader 10 показывают удивительную точность распознования текста. На страницу из 300 книг было найден всего десяток неправильных символов (это то, что подсвечивает Word)

А теперь нам нужен OpenOffice. Не сколько он сам, а мега-плагин OOoFBTools.

Он нам нужен по двум причинам:

  1. Почистить текст (OOoFBTools -> Корректор текста)
  2. Разметить текст и сделать FB2 книгу

После установки плагина необходимо зайти в Файл->Шаблоны->Управление и загрузить файл шаблонов из архива с плагином.

Затем, OOoFBTools->Загрузка шаблона стилей в документ. F11

Получаем панель с основными стилями. Выделяем в тексте кусок, применяем подходящий стиль.

Стилями Livel* выделяются названия глав, разделов и прочего территориально-административного деления. Потом по этим данным будет создано оглавление.

Другие стили нужны для того, чтобы в книгочиталке (железной или программной) текст шел не сплошной волной, а отдельно были выделены вещи вроде эпиграфов, цитат и других полезных вещей.

Если скан хороший, то вся работа займет около полутора часов.

Связано с категорией: ebook Нет комментариев
27Мар/100

А ведь качественно делают

Связано с категорией: Кино, чего-чего? Нет комментариев
27Мар/100

iRiver Story. Еще про PDF

У PDF есть еще одно нехорошое для нашего дела свойство, о котором стоит сказать отдельно от книжек-картинок и книжек-с-текстом.

Когда Adobe придумало PDF у них в мыслях была очень хорошая идея: PDF должен на любом устройстве выглядеть одинаково. Что они в итоге и сделали.

Но тогда никто и не подумывал о мобильных устройствах. А они в итоге появились и развились до такого уровня, что там тоже завелись книги.

И проблема встала в полный рост: PDF файл содержит не только текст, но и всё оформление, которое просто так из него не вырежешь. Поэтому смотреть на красивую, подготовленную к печfти книгу на маленьком экране не очень и получается.

Хотя iRiver и не пасует перед сложным форматированием (и даже шрифтами!) и даже видно буквы, но читать трудно.

Adobe тоже осознала глубину проблемы и в итоге родила технологию Reflow, которая позволяет убирать форматирование с PDF и показывать более-менее приличный текст.

«Более-менне»  — это потому что иногда форматирование всё таки непобеждаемое и блоки текста оказываются в книге не в таком порядке как требуется. А если снять форматированние с предыдущей картинки, то там текст и картинки перемешаются в кашу и страницы разъедется. Хотя чаще всего результат всё равно приемлимый.

Как пишут в обзорах, у iRiver Story очень хорошая поддержка PDF. Вроде там даже родной Adobe-овский софт для этого дела и привинчен.

Ну и на сайте можно скачать Adobe Reader для мобильных платформ и Adobe Digital Editions для PC.

Но самый лучший, хотя и затратный по времени способ, — это распознать в FineReader и потом собрать книгу в нормальном формате.

Связано с категорией: ebook Нет комментариев