Berp — довольно интересный компилятор Python

Недавно я наткнулся на один любопытный проект. Он называется Berp и представляет собой транслятор скриптов на языке Python в программы на Haskell. Со стороны пользователя Berp выглядит как интерпретатор и компилятор Python, поскольку вся трансляция происходит «в бэкенде».

***

Проект достаточно молод. Чтобы попробовать Berp, нужно самостоятельно собрать его из исходников. Сами исходники лежат на гитхабе. Сборка происходит примерно таким образом:

cabal update
cabal install haskell-src-exts language-python parseargs
cabal install MonadCatchIO-mtl

cd path/to/unzipped/bjpop-berp-63eb4a0/libs
cabal configure
cabal install

cd ../compiler
cabal configure
cabal build
cd dist/build/berp

Не могу не отметить, что компилировать программы на Haskell — одно удовольствие. Никакой возни с настройкой программы под свою систему, поиском библиотек или различными версиями компиляторов. Кто пробовал собирать в Visual Studio программы, написанные под GCC, тот понимает, о чем речь.

Итак, в результате описанных выше шагов, мы получили компилятор berp.exe (я тестировал Berp под Windows). Теперь попробуем скомпилировать с его помощью простенький скрипт:

1
2
3
#!/usr/bin/env python

print("Hello!")

Говорим:

berp test.py
test.exe

Должны увидеть:

Hello!

Размер полученного исполняемого файла составил 3 Мб. Многовато, конечно, но жить можно. В экзешнике был замечен традиционный для Haskell «мусор», который можно вычистить с помощью утилиты strip. (Подробнее о тюнинге программ на Haskell можно прочитать в заметке, посвященной wxHaskell.) В таблице импорта никаких лишних библиотек не обнаружилось.

Помимо самой программы, Berp также создал два файла следующего содержания. Файл Main.hs:

1
2
3
4
5
module Main where
import Prelude ()
import Berp.Base (run)
import Berp_test (init)
main = run init

Файл Berp_test.hs:

1
2
3
4
5
6
module Berp_test (init) where
import Prelude ()
import Berp.Base
init globals
  = do _t_0 <- readGlobal globals (177724922, "_s_print")
       _t_0 @@ [string "Hello!"]

Насколько я могу судить, использовать этот код в своих программах на Haskell будет затруднительно.

***

Здорово, конечно, что такой простенький пример успешно собрался, но ведь нас с вами обычно интересуют программы посложнее, не так ли? Сначала я хотел написать скрипт, выводящий квадратные корни чисел от 1 до 100, но выяснилось, что питоновский модуль math написан на Си.

Таким образом, не ясно, как его использовать в Berp. Мы даже не можем воспользоваться модулями PyPy, хотя, как я понимаю, все они написаны без использования Си. Дело в том, что PyPy — это реализация Python 2.7, а Berp понимает только Python 3. В некоторых отношениях различия между этими языками довольно существенны.

Тогда я сваял следующий пример. Файл mymodule.py:

1
2
3
4
#!/usr/bin/env python

def getHello():
  return("Hello from mymodule!")

Файл test.py:

1
2
3
4
5
#!/usr/bin/env python

from mymodule import getHello

print(getHello())

Этот пример успешно компилируется, но при запуске выдает ошибку:

test.exe: Berp_mymodule.hs:6:19-61: Non-exhaustive patterns in lambda

Если кому интересно, файл Berp_mymodule.hs:

1
2
3
4
5
6
7
module Berp_mymodule (init) where
import Prelude ()
import Berp.Base
init globals
  = do _t_0 <- def 0 none
                 (\ [] -> ret (string "Hello from mymodule!"))
       writeGlobal globals (9072933, "_s_getHello") _t_0

Файл Berp_test.hs:

1
2
3
4
5
6
7
8
9
10
11
12
module Berp_test (init) where
import Prelude ()
import Berp.Base
import qualified Berp_mymodule (init)
init globals
  = do _t_0 <- importModule "mymodule" Berp_mymodule.init
       _t_1 <- _t_0 . (9072933, "_s_getHello")
       writeGlobal globals (9072933, "_s_getHello") _t_1
       _t_2 <- readGlobal globals (177724922, "_s_print")
       _t_3 <- readGlobal globals (9072933, "_s_getHello")
       _t_4 <- _t_3 @@ []
       _t_2 @@ [_t_4]

Main.hs остался таким же, как и в предыдущем примере.

***

Ок, с импортом вышел небольшой косяк. Но как Berp работает с остальными конструкциями языка? Чтобы выяснить это, нужно попробовать собрать какую-нибудь реальную и при этом довольно сложную программу. На ум ничего хорошего не пришло, так что я тупо переписал (в который раз) программу, решающую задачу о кодировании цифр. Отдельно пришлось повозиться с допиливанием скрипта под Python 3. В итоге получилось следующее:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
#!/usr/bin/env python

# (c) Alexandr A Alexeev 2011 | http://eax.me/

from functools import reduce

def nub(lst):
  seen = set()
  rslt = list()
  for itm in lst:
    if itm not in seen:
      seen.add(itm)
      rslt.append(itm)
  return rslt
 
def nub2(lst): # lists are not hashable, but tuples are
  tmp = nub( list(map(lambda x: tuple(x), lst)) )
  return list(map(lambda x: list(tmp), tmp))

def signalsNumber(sigSet):
  return len(sigSet)

def bitsNumber(sigSet):
  return len(sigSet[0])
 
def allSignals(bits):
  if bits == 0:
    return [[]]
  rest = allSignals(bits-1)
  return list(map(lambda x: [False] + x, rest)) + \
    list(map(lambda x: [True] + x, rest))

def allDefects(bits):
  return allSignals(bits)

def isCriticalDefect(defect, sigSet):
  defectedSigSet = nub2( list(map(lambda s: \
    list(map(lambda x: x[0] & x[1], zip(s,defect))), sigSet)) ) # zipWith =/
  return signalsNumber(sigSet) != signalsNumber(defectedSigSet)

def allNoncriticalDefects(sigSet):
  defects = allDefects(bitsNumber(sigSet))
  return list(filter(lambda x: not(isCriticalDefect(x, sigSet)), defects))
 
def solveFirstTask(signSet):
  defects = allNoncriticalDefects(signSet)
  temp = list(map(lambda t: \
    (reduce(lambda x, b: x if b else x + 1, t, 0), [t]), defects))
  return reduce(lambda a, b: \
    ( (a[0], a[1] + b[1]) if b[0] == a[0] else b ) if b[0] >= a[0] \
    else a, temp)
   
def solveSecondTask(signSets):
  solutions = zip( list(map(lambda x: solveFirstTask(x), signSets)), \
    list(map(lambda x: [x], signSets)) )
  return reduce(lambda x, y: \
    ( (x[0], x[1] + y[1]) if x[0][0] == y[0][0] else x) \
    if x[0][0] >= y[0][0] else y, solutions)
 
def intArrToSignalSet(mtx):
  return list(map(lambda lst: list(map(lambda itm: itm != 0, lst)), mtx))
 
def sevenPosSignalSet():
  return intArrToSignalSet([
    [1, 1, 1, 0, 1, 1, 1], # 0
    [0, 0, 1, 0, 0, 1, 0], # 1
    [1, 0, 1, 1, 1, 0, 1], # 2
    [1, 0, 1, 1, 0, 1, 1], # 3
    [0, 1, 1, 1, 0, 1, 0], # 4
    [1, 1, 0, 1, 0, 1, 1], # 5
    [1, 1, 0, 1, 1, 1, 1], # 6
    [1, 0, 1, 0, 0, 1, 0], # 7
    [1, 1, 1, 1, 1, 1, 1], # 8
    [1, 1, 1, 1, 0, 1, 1], # 9
    ])
   
   
def ninePosSignalSet():
  return intArrToSignalSet([
    [1, 1, 0, 1, 0, 1, 0, 1, 1], # 0
    [0, 0, 1, 1, 0, 0, 0, 1, 0], # 1
    [1, 0, 0, 1, 0, 0, 1, 0, 1], # 2
    [1, 0, 1, 0, 1, 0, 1, 0, 0], # 3
    [0, 1, 0, 1, 1, 0, 0, 1, 0], # 4
    [1, 1, 0, 0, 1, 0, 0, 1, 1], # 5
    [0, 0, 1, 0, 1, 1, 0, 1, 1], # 6
    [1, 0, 1, 0, 0, 1, 0, 0, 0], # 7
    [1, 1, 0, 1, 1, 1, 0, 1, 1], # 8
    [1, 1, 0, 1, 1, 0, 1, 0, 0], # 9
    ])

def unpackIntArrays(mtx):
  return reduce( lambda x, y: \
    [a + [b] for a in x for b in y ], mtx, [[]])
   
def multipleNinePosSignalSets():
  unpacked = unpackIntArrays([
    [[1,1,0,1,0,1,0,1,1]],
    [[0,0,1,1,0,0,0,1,0],[0,0,0,1,0,0,0,1,0],[0,1,0,0,0,1,0,0,0]],
    [[1,0,0,1,0,0,1,0,1],[1,0,0,1,1,1,0,0,1]],
    [[1,0,1,0,1,0,1,0,0],[1,0,0,1,1,0,0,1,1],[1,0,1,0,1,0,0,1,1]],
    [[0,1,0,1,1,0,0,1,0],[0,0,1,1,1,0,0,1,0]],
    [[1,1,0,0,1,0,0,1,1],[1,1,0,0,1,0,1,0,0]],
    [[0,0,1,0,1,1,0,1,1],[1,1,0,0,1,1,0,1,1]],
    [[1,0,1,0,0,1,0,0,0],[1,0,0,1,0,0,0,1,0],[1,0,0,1,0,0,1,0,0]],
    [[1,1,0,1,1,1,0,1,1]],
    [[1,1,0,1,1,0,1,0,0],[1,1,0,1,1,0,0,1,1]]
    ])
  return list(map(lambda x: intArrToSignalSet(x), unpacked))

Следует отметить, что писать в функциональном стиле на Python оказалось намного проще и приятнее, чем на Perl. Кроме того, приведенный скрипт довольно экономно использует память («палка» на графике, как и в случае с Haskell) и работает вполне быстро (хотя и во много раз медленнее аналогичной программы на Haskell).

К сожалению, мне не удалось найти в стандартной библиотеке аналогов функций nub и zipWith. Также для меня остается загадкой, за каким хреном в Python 3 перенесли функцию reduce в отдельный пакет. А еще в третьем питоне стало сложнее использовать функции map и filter, потому что вместо списков они теперь возвращают объекты.

Однако вернемся к Berp. Собрать приведенную выше программу он не в состоянии. Вопреки моим надеждам, встроенной функции reduce в нем не оказалось, а на попытку ее импорта из functools мы получаем:

berp: Python source file not found: functools.py

В итоге reduce пришлось дописать:

def reduce(f, lst, x = None):
  if x is None:
    x = lst[0]
    lst = lst[1:]
   
  for i in lst:
    x = f(x, i)
  return x

Далее вылез такой косяк:

berp: berp unsupported. x if b else x + 1

Пытаемся пофиксить и его:

def if_else(c, a, b):
  if c:
    return a
  else:
    return b

И тут наступает epic fail:

berp: berp unsupported. lst[1:]

Кроме того, выяснилось, что Berp не поддерживает конструкцию «not in»:

berp: berp unsupported. opExp: NotIn {op_annot = SpanCoLinear
{span_filename = "lamp.py", span_row = 9, span_start_column
= 12, span_end_column = 17}}

В общем, ужас!

***

На момент написания этих строк пользоваться Berp было невозможно. Поддержка синтаксиса Python 3 реализована в нем лишь частично. Также не совсем понятно, откуда следует брать стандартные библиотеки. Как я уже отметил, библиотеки PyPy в данном случае не годятся.

Тем не менее, проект довольно интересен. Я искренне надеюсь, что автор (Bernie Pope) его не забросит. Особенно мне понравилась идея трансляции чего бы то ни было именно в Haskell, а не традиционные Си и C++. Ведь в этом случае мы получаем не только более хорошую переносимость, но и множество фирменных фишек Хаскеля.

Надо будет посмотреть на Berp еще разок где-нибудь через год.

Подпишитесь на блог с помощью RSS, E-Mail, Google+ или Twitter!
Также, пользуясь случаем, приглашаю вас посетить мой форум.

  • Дмитрий Карих

    Спасибо, за обзор. Положу в закладки, если проект не забросят в будущем может получиться неплохой инструмент.