Современная электронная библиотека ModernLib.Net

Введение в Perl

ModernLib.Net / Базы данных / Маслов Владимир Викторович / Введение в Perl - Чтение (стр. 1)
Автор: Маслов Владимир Викторович
Жанры: Базы данных,
Программирование

 

 


Владимир Викторович Маслов

Введение в Perl

Copyright (C) Маслов Владимир Викторович

Все замечания и предложения направляйте по адресу:

maslov@klgtts.kaluga.su

maslov@news.kaluga.rosmail.com


Все примеры в книге проверены для Перл версии 5.003

операционной системы Unix FreeBSD 2.1.0.

От простого к сложному

Прежде чем приступить к последовательному ознакомлению с не знакомым для вас языком, должен оговориться и сказать, что все примеры да и сам язык описанию которого посвящена эта книга это Perl версии 5.003 для операционной системы FreeBSD версии 2.01. Существуют реализации этого языка для операционных систем OS/2 , MS-DOS и Windows NT но они немного отстают по возможностям от оригинала, рожденного в недрах Юникса.

Пример 1 Введите в файл test1.pl следующие строки:

#!/usr/local/bin/perl

# Содержимое файла test1.pl

print «Наше Вам с кисточкой!\n»;

А теперь подробно разберем каждую строку.

#!/usr/local/bin/perl

Данная строка должна быть первой в любой Перл-программе.

Она указыванет системному интерпретатору что данный файл – это Перл-программа.

# Содержимое файла test1.pl

Эта строка называется комментарием. Она всегда начинается символом '#' и заканчивается таким объяснением что как говорил великий Ходжа Насреддин «это тонкий филосовский вопрос», а говоря простым языком здесь можно писать все что угодно.

Даже пожелание руководству. Уж здесь оно точно до него не дойдет.

print «Наше Вам с кисточкой!\n»;

Самая последняя ну и конечно главная. Она просто выводит на экран надпись «Наше Вам с кисточкой!».

Здесь слово print – это команда «вывести». Все что в кавычках – это символы, \n – перевод строки и ';' – признак конца команды. Он обязателен.

В одной строке может быть несколько команд и все они должны завершаться символом ';'. После него может быть символ '#' – это значит остаток строки считается комментарием.

Над этой строкой автору пришлось больше всего поломать голову так как в нее постоянно лезли какие то странные «hello», «hello all», «Построемся и спасемся», «Строй наше спасение» и т.д и т.п.

Если вы никогда не работали с Перл, то бъюсь на спор в 10$, что данная программа сразу у вас не заработает!

Не потому что она не верна, а потому что «Нельзя объять необъятное».

Сразу, потом можно, да и то частями.

Сначало сделайте ваш файл test1.pl исполняемым. Для этого введите команду:

chmod +x test1.pl

Затем проверьте где у вас Перл. Для этого введите:

which perl

Система вам выдаст что то вроде:

/usr/bin/perl

Если:

perl: Command not found.

То тогда закройте книжку и ложитесь спать. У вас просто нет Перл или он не установлен. А мне остается послать вас к системному администратору или к man (для переводчиков– man сокращение от manual а не то что вы подумали).

Теперь проверьте что бы строка 01 содержала то что выдала команда which.

Если совпало то введите:

test1.pl

и бъюсь на 50$ что и теперь программа не заработает, так как правильней

ввести:

./test1.pl

Если я проиграл, то не радуйтесь. Да же если вам удалось запустить программу как test1.pl это значит, что у вас будут неприятности в будущем.

Пример 2 Данная программа выводит на экран все ваши секреты. А именно файл /etc/passwd.

#!/usr/local/bin/perl

open(PASS, «

while()

{

print;

}

close(PASS);

Пояснения:

open(PASS, «

«Открыть» файл т.е. создать указатель файла PASS и в случае ошибки выдать «Файл не найден!» и закончить программу.

while()

Читать по одной строке файла в переменную по умолчанию $_.

{

Открыть блок операторов.

print;

Вывести на экран переменную по умолчанию $_

}

Конец блока.

close(PASS);

Закрыть файл. Этого можно и не делать так-как файл автоматически закроется после окончания программы.

Результат работы этой программы тот же что и команды cat /etc/passwd.

По экрану пробежали непонятные строки но зато теперь перед вами открыты горизонты Перл программирования!

Все последующие примеры будут развитием этой программы и она превратится из гадкого утенка в прекрасного лебедя (не генерала).

Пример 3 Разделение полей.

#!/usr/local/bin/perl

open(PASS, «

while()

{

($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');

print «$login \t $name\n»;

}

close(PASS);

Пояснение:

($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');

Присвоить указанным переменным поля входной строки, считая разделителем символ ':'.

print «$login \t $name\n»;

Вывести login – имя пользователя и его описание. Поля разделены символом '\t' – табуляции.

Пример 4 Вывести имена пользователей отсортированных по группам.

#!/usr/local/bin/perl

open(PASS, «sort -n -t : +3 -4 +0 /etc/passwd|») || die «Файл не найден!»;

while()

{

($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');

print «$login \t $gid \t $name\n»;

}

close(PASS);

Поеснения:

open(PASS, «sort -n -t : +3 -4 +0 /etc/passwd|») || die «Файл не найден!»;

В данной строке весь фокус! Входным файлом для нашей программы стал выход команды sort которая и отсортирует входные данные.


Форматированный вывод.

Ну а теперь напечатаем на экране все наши данные в удобной форме.

#!/usr/local/bin/perl

open(PASS, «sort -n -t : +3 -4 +0 /etc/passwd|») || die «Файл не найден!»;

while()

{

($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');

write(); # Форматированный ывод данных.

}

close(PASS);

exit 0; # Завершение программы

############ Описание формы вывода ##################

format STDOUT =

Пользователь:

^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

$name

^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

$name

^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

$name

Login:@<<<<<<<< Uid:@<<< Gid:@<<< Home dir:@<<<<<<<<<<<<<<<<<<<<<

$login, $uid, $gid, $home_dir

. # Это последняя строка программы

Фрагмент результата:

Пользователь: Калужский ликеро-водочный завод. Лучшие водки и

настойки. Звонить только перед праздником Кострикову

Анатолию т. 2-23-06,,,

Login:uucryst Uid:1055 Gid:66 Home dir:/var/spool/uucppublic/

Пользователь: Торговый Дом Дилен,,,

Login:uudilen Uid:1075 Gid:66 Home dir:/var/spool/uucppublic

Если вам интересно узнать как работает эта программа, то переверните

страницу и начините свое путешествие в мире Перл.

Желаю удачи!

Запуск интерпретатора Перл

Синтаксис:

perl [ключи] файл аргументы

Перед стартом Перл ищет скрипт (программу) в следующем порядке:

1. В командной строке если указан ключ '-e'

2. Содержимое файла указанного в командной строке. В первой строке можно указывать #!/usr/bin/perl для «автоматического» запуска скрипта.

3. Стандартный ввод/вывод если не указан файл или аргументы содержащие имя файла. Для передачи аргументов скрипту из стандартного потока имя файла в командной строке обозначается символом '-'.

В методах 1 и 2 Перл сканирует строки начиная с первой если не указан ключ '-x', в противном случае началом программы считается строка с символами '#!' в начале и содержащая слово 'perl'.

Концом программы считается строка '__END__'.

В строке с '#!' можно указывать и ключи. Например '#!/bin/perl -d' для отладки программ.

После «обнаружения» скрипта Перл компилирует его целиком во внутреннее представление. Если обнаруживаются ошибки то выполнение прекращается. Если ошибок нет он выполняется. Если скрипт заканчивается без команд exit() или die() то по умолчанию выполняется команда exit(0) обозначающая нормальное завершение программы.

Ключи:

-Oцифры

Код символа-разделителя записей. По умолчанию \0.

-a

Включает режим автоматического разделения (split) переменной $_ в массив $F. Применяется с ключами -n и -p.

-c

Выполняется синтаксическая проверка скрипта и выход без запуска.

-d

Запуск в режиме интерактивной отладки.

-Dчисло или Dсписок

Установить флаги отладки Перл. Например -d14 проследить как Перл исполняет вашу программу.

1 p Синтаксический разбор

2 s Состояние стека

4 l Состояние стека имен

8 t Трассировка исполнения

16 o Создание оператора узла

32 c Строковое/числовое преобразование

64 p Вывод команды препроцессора для -P

128 m Распределение памяти

256 f Обработка формата

512 r Синтаксический разбор регулярных выражений

1024 x Дамп синтаксического дерева

2048 u Проверка защиты

4096 L «Утечка» памяти

8192 H Дамп хеша

16384 X Распределение scratchpad

32768 D Очистка

-e команда

Выполнение скрипта из одной строки указанного в командной строке.

-F шаблон

Указывает шаблон разделения в режиме работы с ключом -a

-iрасширение

Применяется для резервной копии файла обрабатываемого оператором '<>'. Оригинал хранится в файле с тем же именем что и исходный, но с указанным расширением.

Пример:

perl -p -i.old -e «s/рядовой/ефрейтор/» file

– Поменять все слова «рядовой» на «ефрейтор» в файле file

а оригинал записать в файле file.old

-Iдиректория

Директория includ- файлов для С препроцессора. Применяется с ключом –P

по умолчанию это /usr/include и /usr/lib/perl.

-lчисло


Автоматическая обработка символа конца строки.

Работает в двух случаях.

1. Отбрасывает последний символ читаемых строк для режимов -n и -p

2. Присваивает указанное значение переменной $\. Таким образом к концу каждой строки выводимой оператором print добавляется этот символ.

-n

Зацикливает скрипт и последовательно обрабатывает файлы указанные в командной строке. Позволяет создавать команды подобные sed или awk.

Операторы BEGIN и END дают возможность делать начальные и конечные установки. Содержимое файлов не выводится.

-p

То же что и -n но печатает обрабатываемые строки файлов.

-P

Предварительная обработко препроцессором языка С. Будьте внимательны и не применяйте в комментариях слова 'if', 'else' или 'define' т.к. это команды С – препроцессора.

-s

Включение режима обработки ключей командной строки запуска скрипта.

Все аргументы с символом '-' в начале, считаются ключом и переменным с таким же именем присваивается значение true.

-S


Использование системной переменной PATH для поиска скрипта.

Данный ключ применяется в системах не воспринимающих последовательность "#!" в начале скрипта для указания интерпретатора.

-T

Режим проверки «дыр» в защите. Обычно это нужно для программ работающих в режиме повышенной привелегии (setuid, setguid). Желательно для CGI скриптов.

-u

Принудительный дамп памяти после компиляции скрипта. Этот дамп можно потом использовать для создания исполняемого файла с помощью программы undump.

-U

Разрешение выполнять опасные операции. Например стереть директорию или выполнять явно не закрытую программу.

-v

Вывод номера версии Перл.

-w

Вывод имен переменных используемых только один раз, имен скаляров используемых до их определения, имен переопределяемых подпрограмм, ссылок на неопределенный указатели файлов, попыток записи в файлы открытых только на «чтение», употребление не коретных записей чисел, использование массивов как скаляров, рекурсия более 100 уровней.

-x директория

Режим запуска скрипта вставленного в файл содержащий обычный текст. Началом скрипта считаестся строка с символами '#!' в начале и содержащия слово perl. Концом – строка с '__END__'

Указанная директория становится текущей в момент исполнения. Если необходимо читать последующие строки то это лучше делать через указатель файла DATA.

Синтаксис

Перл программа (скрипт) состоит из последовательности деклараций и предложений.

Единственно что должно быть обязательно декларировано это форматы отчетов и подпрограммы (функции). Все не объявленные переменные, массивы, имеют значение 0 или null.

Декларации (объявления).

Перл имеет свободный формат. Комментарии начинаются с символа '#' и продолжаются до конца строки.

Декларации могут использоваться в любом месте программы так же как и предложения (statements) но действуют они только в фазе компиляции программы. Обычно их помещают или в начале или в конце программы.

Декларация подпрограмм позволяет использовать имя подпрограммы как списковый оператор начиная с момента декларирования.

Пример:

sub test; # Декларация подпрограммы test

$var1 = test $0; # Использование как оператора списка.

Декларации подпрограмм могут быть загружены из отдельного файла предложением require или загружено и импортировано в текущую область имен предложением use. Подробно см. главу Модули.

Простое предложение.

Простое предложение обязательно заканчивается символом ';' если только это не последнее предложение в блоке где ';' можно опустить. Заметьте что существуют операторы такие как eval{} и do{} которые выглядят как сложные предложения но на самом деле это термы и требуют обязательного указания конца предложения.

Любое простое предложение может содержать single модификатор перед ';'. Существуют следующие single модификаторы:

if EXPR

unless EXPR

while EXPR

until EXPR

где EXPR – выражение возвращающее логическое значение true или false.

Модификаторы while и until вычисляются в начале предложения кроме блока do который выполняется первым.

if EXPR– Модификатор «если». Предложение выполняется если EXPR возвращает true.

Пример:

$var = 1;

$var2 = 3 if $var > 0; # Результат: $var2 = 3

while EXPR – Модификатор «пока». Предложение выполняется столько раз покаEXPR = true

Пример:

$var = 1;

print $var++ while $var < 5; # Печать $var с инкрементом

Результат: 1234


until EXPR – Модификатор "до ". Предложение выполняется до тех пор пока EXPR = false

Пример:

$var = 1;

print $var++ until $var > 5; # Печать $var с инкрементом

Результат: 12345

unless EXPR – Модификатор «если не» . Обратный к if. Выражение выполняется есле EXPR = false.

Пример:

$var = 1;

print $var++ unless $var > 5; # Печать $var с инкрементом

Результат: 1


Сложные предложения.

Последовательность простых предложений ограниченная функциональными ограничителями называется блоком. В Перл это может быть целый файл, последовательность предложений в операторе eval{} или чаще всего это множество простых предложений ограниченных круглыми скобками '{}'.

Сужествуют следующие виды сложных предложений:

if (EXPR) BLOCK

if (EXPR) BLOCK else BLOCK

if (EXPR) BLOCK elsif (EXPR) BLOCK ... else BLOCK

LABEL while (EXPR) BLOCK

LABEL while (EXPR) BLOCK continue BLOCK

LABEL for (EXPR; EXPR; EXPR) BLOCK

LABEL foreach VAR (LIST) BLOCK

LABEL BLOCK continue BLOCK

Обратите внимание, что сложные предложения описаны в термах блоков а не предложений как в языках C или Pascal. Поэтому необходимо всегда использовать круглые скобки для обозначения блока.

if (EXPR) BLOCK – Вычисляется логическое выражение EXPR и если true блок выполняется.

Пример:

$var =1;

if ($var == 1)

{ print $var,"\n";

}

Результат: 1


if (EXPR) BLOCKelseBLOCK2 – Если EXPR=true выполняется BLOCK иначе BLOCK2.

Пример:

$var =2;

if ($var == 1)

{ print «\$var = 1\n»;

}

else

{ print «\$var не равно 1\n»;

}

Результат: $var не равно 1

if (EXPR1) BLOCK1 elsif (EXPR2) BLOCK2 ... else BLOCK – Если EXPR1=true выполняется BLOCK1 иначе если EXPR2=true выполняется BLOCK2 иначе ... иначе BLOCK.

Пример:

$var = 1;

if ($var == 0)

{ print «\$var = 0\n»;

}

elsif ($var == 1)

{ print «\$var = 1\n»;

}

else

{ print «Не известное \$var\n»;

}

Результат: $var = 1

Цикл while выполняет BLOCK до тех пор пока EXPR = true. Метка LABEL не обязательна и состоит из идентификатора завершающегося символом ':'. Метка необходима при использовании внутри блока цикла управляющих операторов next, last и redo. Если метка все же отсутсвует то эти операторы ссылаются к началу ближайшего цикла.

Блок после continue выполняется всегда перед тем как вычисляется логическое выражение EXPR. Это подобно EXPR3 в предлжении for поэтому в этом блоке удобно изменять счетчики и флаги цикла даже если применяестя оператор next.


Операторы управления циклом.

next – подобен continue в С. Переходит к началу текущего цикла т.е. повторяет итерацию.

Пример:

M1:

while ($i < 6)

{

++$i; # Увеличиваем счетчик на 1

next M1 if $i < 3; # Переходим в начало если $i < 3

++$i; # иначе увеличиваем счетчик еще раз на 1

}

continue

{

print "$i "; # Печатаем $i

}

Результат: 1 2 4 6

last – подобен оператору break в языке С. Немедленно прерывает цикл. Блок continue пропускается.

Пример:

M1:

while ($i < 6)

{

++$i; # Увеличиваем счетчик на 1

last M1 if $i > 3; # Выход из цикла если $i > 3

++$i; # иначе увеличиваем счетчик еще раз на 1

}

continue {

print "$i "; # Печатаем $i

}

Результат: 2 4

redo – начать новый цикл не вычисляя EXPR и не выполняя continue блок.

Пример:

M1:

while ($i < 6)

{

++$i; # Увеличиваем счетчик на 1

redo M1 if $i == 3; # Далее пропустить для $i = 3

++$i; # иначе увеличиваем счетчик еще раз на 1

}

continue {

print "$i "; # Печатаем $i

}

Результат: 2 5 7


Цикл for.

LABEL for (EXPR1; EXPR2; EXPR3) BLOCK

Оператор for полностью аналогичен оператору for в С. В перед началом цикла выполняется EXPR1, если EXPR2 = true выполняется блок, затем выполняется EXPR3.

Пример:

for ($i = 2; $i < 5; ++$i)

{

print $i, " ";

}

print «\nПосле цикла i = $i\n»;

Результат:

2 3 4

После цикла i = 5


Цикл foreach.

LABEL foreach VAR (LIST) BLOCK

Переменной VAR присваивается поочередно каждый элемент списка LIST и выполняется блок. Если VAR опущенно то элементы присваиваются встроеной переменной $_. Если в теле блока изменять значение VAR то это вызовет изменение и элементов списка т.к. VAR фактически указывает на текущий элемент списка.

Вместо слова foreach можно писать просто for – это слова синонимы.

Пример:

@месяц = («январь»,"февраль","март"); # Создали массив

foreach $i (@месяц)

{

print $i," "; # Печать $i

}

Результат: январь февраль март

Пример:

@месяц = («январь»,"февраль","март"); # Создали массив

foreach $i (@месяц)

{

$i = uc($i); # Перевели в верхний регистр

}

print @месяц;

Результат: ЯНВАРЬФЕВРАЛЬМАРТ

Пример:

for $i (3,5,7)

{

print "$i ";

}

Результат: 3 5 7


Блоки и оператор switch.

Блок не зависимо от того имеет он метку или нет семантически представляет собой цикл который выполняется один раз. Поэтому действие опраторов цикла next, last, redo – аналогично описанному выше. Блоки удобны для построения switch (переключатель) структур.

В Перл нет специального оператора switch подобного языку С поэтому вы сами можете создавать удобные для вас конструкции.


Опыт автора показывает что для простоты написания лучше всего подходит конструкция вида if ... elsif ... else ... хотя можно сочинить и нечто подобное:

SWITCH:

{

if ($i ==1 ) { .....; last SWITCH; }

if ($i ==2 ) { .....; last SWITCH; }

if ($i ==3 ) { .....; last SWITCH; }

$default = 13;

}

Выбирайте сами по своему вкусу.


Оператор goto.

В Перл существует оператор goto хотя где , как и когда его применять как говорил Ходжа Насредин «Тонкий филосовский вопрос».

Для начинающих программистов которым от так «нужен» я бы вообще посоветовал «забыть» о его существовании. Однако при создании больших производственных задач на последнем этапе особенно при отработке «отвальных» ошибочных ситуаций конечно goto нужен.

В Перл реализовано три формы goto. goto – метка, goto – выражение и goto – подпрограмма.

goto – метка выполняет непосредственный переход на указанную метку.

goto – выражение – Вычисляет имя метки и делает соответсвующий переход.

Например если мы хотим сделать переход на одну из трех меток "M1:", "M2:" или "M3:" в зависимости от значений переменной $i равной 0, 1 или 2 то это лучше сделать следующим образом:

goto («M1», «M2», «M3»)[$i];

здесь $i используется как индекс массива указанного непосредственно в выражении.

goto подпрограмма – довольно редкий случай т.к. всегда проще и надежней вызвать подпрограмму «естественным» образом.


POD операторы. Документирование программ.

В Перл реализован очень удобный механизм для написания документации в момент создания программы. Для этого применяются специальные POD операторы.

Если в теле программы интерпретатор встречает оператор начинающийся с символа '=' например:

= head Набор стандартных процедур

то пропускается все до слова '=cut'. Это удобно для включения длинных на несколько строк или страниц комментариев. Затем

с помощью специальной программы pod можно отделить текст документации от текста программы.

Переменные


  • Страницы:
    1, 2, 3, 4, 5, 6