Современная электронная библиотека ModernLib.Net

Введение в Perl

ModernLib.Net / Базы данных / Маслов Владимир Викторович / Введение в Perl - Чтение (стр. 3)
Автор: Маслов Владимир Викторович
Жанры: Базы данных,
Программирование

 

 


c d

a b 1

Здесь мы имеем списковый оператор print. Для запятых слева от него он имеет наименьший приоритет, но повышает приоритет правой запятой.

Поэтому правая запятая воспринимается как параметр для print и печатается 'c d' а левая просто записывает код завершения операции в массив @i и последний print показывает это.


Оператор '->'

Так же как в С или С++ это инфиксный оператор переадрессации. Если справа от него стоит [...] или {...} выражение, то правая часть может быть непосредственной или символической ссылкой на массив или хеш.

В противном случае правая сторона это метод или простой скаляр содержащий имя метода, а правая или объект или имя класса. Подробно смотри главу «Классы».


Операторы ++ (инкремент) и (декремент).

Эти операторы работают так же как и в С. Если оператор стоит перед переменной то значение переменной изменяется на 1 и полученной значение используется. Если после переменной то ее величина изменяется после применения.

Употребление инкремента к строковым переменным в Перл имеет одну особенность.

Каждый символ остается в своем классе (большие, малые, цифры) и учитывается перенос предыдущего символа. Таким образом строковые переменные с цифрами работают как числовые переменные.

Пример:

print ++($i = «09»); # Результат «10»

print ++($i = «a9»); # «b0»

print ++($i = «az»); # «ba»

print ++($i = «aZ»); # «bA»


Оператор ** (возведение в степень)

Пример:

print 4**2 # Результат 16

print -4**2 # Результат -16 т.е. -(4**2)


Унарные операторы.

'!' – логическое отрицание

'-' – арифметический минус

'~' – побитная инверсия (дополнение до 1)

'+' – арифметический плюс

'\' – получение ссылки на переменную (как & в С)


Операторы «привязки» =~ и !~ .

Эти «необычные» я бы даже сказал оригинальные операторы имеют очень широкое применение в Перл. Можно даже назвать их «оригинальным» решением.

Оператор =~ логически связывает левую часть выражения с патерном (pattern – образец, шаблон, модель) в правой. По умолчанию поиск или изменение по патерну выполняется в переменной $_ Операторы привязки позволяют делать это с любой переменной указанной в левой части. Логическим результатом будет успех операции. Если в правой части вместо патерна присутсвует выражение, то результат этого выражения воспринимается как патерн. Однако это не очень эффективно т.к. патерн будет компилироваться во время исполнения программы что заметно снизит быстродействие. 

Оператор !~ аналогичен =~ только результат совпадения инвентируется (логическое «нет»). Подробное применение этих операторов приводится в главе «Патерны».


Мультипликативные операторы.

'*' – арифметическое умножение

'/' – арифметическое деление

'%' – арифметический модуль

'x' – оператор повторения

В скалярном контексте возвращает строку левой части повторенную величиной указанной в правой части. В списковом контексте, если в левой части список в круглых скобках – повторенный список.

Пример:

print '*' x 5; # Результат '*****'

print (1,2) x 3; # Результат 121212


Аддитивные операторы.

'+' – арифметический плюс

'-' – арифметический минус

'.' – конкатенация (объединение) строк


Операторы сдвига.

'<<' – Сдвигает побитно влево значение выражения в левой части на количество бит указанное в правой.

'>>' – Сдвигает побитно вправо значение выражения в левой части на количество бит указанное в правой.


Именованные унарные операторы.

Фактически это функции с одним аргументом. Круглые скобки можно опускать.

Операторы отношений.

'<' – арифметическое меньше

'>' – арифметическое больше

'<=' – арифметическое меньше или равно

'>=' – арифметическое больше или равно

'lt' – строковое меньше

'gt' – строковое больше

'le' – строковое меньше или равно

'ge' – строковое больше или равно


Операторы равенства.

'==' результат true если левая часть равна правой (равно)

'!=' – не равно

'<=>' – -1 если левая часть меньше правой, 0 если равна, 1 если больше.

'eq' – строковое равно

'ne' – строковое не равно

'cmp' – как и '<=>' применительно к строкам


Операторы работы с битами.

'&' – побитное AND

'|' – побитное OR

'^' – побитное XOR


Логические операторы && (AND) и || (OR).

'&&' – если левое выражение возвращает false, правое не выполняется.

'||' – если левое выражение возвращает true, правое не выполняется.

Отличие от подобных операторов в С заключается в том, что в С возращаемое значение либо 0 либо 1. Тогда как в Перл возвращается результат выражения.


Оператор диапазона '..'

Результат работы данного оператора зависит от контекста. В списковом контексте результат есть список с элементами. Первый элемент которого это левое выражение и последнее – правое.

Значение каждого элемента внутри списка увеличивается на 1.

Данный оператор удобен для небольших циклов т.к. память отводится для всего списка целиком. Поэтому будьте внимательны и не задавайте слишком большой диаппазон.

Пример:

for $i (1..4)

{ print "$i ";

}

Результат: 1 2 3 4

В скалярном контексте результат – логическое значение. Каждая '..' операция устанавливает свое собственное состояние. Это false до тех пор пока левый операнд false. Как только левый операнд стал true результат – true до тех пока правый true, после чего результат опять – false. Если вы не хотите проверять правый операнд то используйте оператор '...'.

Правый операнд не вычисляется пока результат false и левый операнд не вычисляется пока пока результат true. Приоритетность оператора '..' немного ниже чем '&&' и '||'. Возвращаемое значение если flase – нулевая строка, если true – порядковый номер начиная с 1. Порядковый номер обнуляется для каждого нового диаппазона.

Последний порядковый номер добавляется строкой "E0" которая не изменяет его значение но позволяет фиксировать последнее значение.

Пример:

@алфавит = ('a'..'z'); # Массив малых букв латинского алфавита

@цифры = (0..9); # Массив цифр


Условный оператор '?:'

Этот оператор работает так же как и в С. Если выражение перед '?' истинно то выполняется аргумент перед ':' – иначе после ':'.

Пример:

$i = 1;

$i > 1 ? print «больше» : print «меньше»;

Результат: меньше


Операторы присваивания.

'=' – обычный оператор «присвоить» правое значение переменной слева Вся эта группа операторов подобна операторам С т.е.

$i += 2;

эквивалентно

$i = $i + 2;

Остальные операторы этой группы работают аналогично.

Допустимы следующие операторы:

**=

+= -= .=

*= /= %= x=

&= |= ^=

<<= >>=

&&= ||=

Приоритет всей этой группы операторов равен приоритету '='.


Оператор ',' (запятая)

В скалярном контексте выполняется левый аргумент, результат игнорируется затем правый и его результат есть результат действия оператора.

В списковом контексте это разделитель элементов списка который включает указанные элементы в список.


Оператор логическое not (орицание).

Унарный not возвращает противоположное значение полученное выражением справа. Он эквивалентен '!' но имеет очень низкий приоритет.


Оператор логическое and (И).

Выполняет логическую конъюнкцию двух выражений. Эквивалентен '&&' но имеет очень низкий приоритет и «краткость» действия. т.е если левое выражение равно false – левое не выполняется.


Логическое or (ИЛИ).

Выполняет логическую дизъюнкцию двух выражений. Эквивалентен '||', но имеет очень низкий приоритет и «краткость» действия. т.е если левое выражение равно true – левое не выполняется.


Логическое xor (исключающее ИЛИ).

Выполняет логическое исключающие или. Всегда выполняются оба правое и левое выражение.


С операторы отсутствующие в Перл.

В Перл отсутсвуют операторы языка С такие как:

унарное & – получить адрес. Для этого применяется '\'.

унарный * – переадресация.

(TYPE) – совмещение типов.


Операторы ограничители строк.

Обычно ограничители строк мы считаем литералами, но в Перл это операторы выполняющие разного рода интерполяцию и поиск по шаблону. Вы можете сами задавать удобные для вас ограничители. В следующей таблице приведен полный перечень вариантов. Фигурные скобки '{}' обозначают любой символ используемый для ограничителя. В случае использования скобок (круглых '()', квадратных '[]', фигурных '{}', угловых '<>') в начале ставится открывающаяся скобка а в конце закрывающая.



По умолчанию Полное Функция Интерполяция

– – – –

'' q{} Literal нет

"" qq{} Литерал да

`` qx{} Команда да

qw{} Список слов нет

// m{} Шаблон да

s{}{} Подстановка да

tr{}{} Трансляция нет


В строках допускающих интерполяцию имена переменных начинающиеся с символов '$' или '@' – интерполируются т.е. в строку вставляется значение строки или массива.

Данные последовательности символов имеют специальное значение:

\t символ табуляции

\n символ новой строки

\r возврат

\f перевод формата

\v вертикальная табуляция

\b backspace (забой)

\a звонок

\e escape

\034 восьмеричный символ

\x1a шестьнадцатеричный символ

\c[ символ управления

\l нижний регистр следующего символа

\u верхний регистр следующего символа

\L нижний регистр для всех символов до \E

\U верхний регистр для всех символов до \E

\E ограничитель смены регистра

\Q отмена действия метасимволов до \E

Шаблоны интерполируются как регулярные выражения. Это выполняется вторым проходом после интерполяции переменных поэтому в шаблоны можно вставлять переменные. Для отмены интерполяции используйте '\Q'. Если вы применяете вложенные ограничители то внутренние ограничители работать не будут.


?PATERN?

?PATERN?

Действие этого оператора аналогично /шаблон/ но выполняется до первого совпадения. Это удобно для поиска наличия какой нибудь строки в одном или множестве файлов. Это не очень удачный оператор поэтому в следующих версиях Перл его возможно не будет.

m/PATERN/gimosx

/PATERN/gimosx

Поиск в строке по патерну (шаблону). В скалярном контексте возвращает логическое значение true (1) или false (''). Если строка не указана с помощью операторов '=~' или '!~' поиск ведется в строке $_

Опции:

 – Глобальный поиск. Поиск всех вхождений.

 – Сравнение не зависит от регистра (верхний или нижний)

m – Строка многострочна.

o – однопроходная компиляция

s – однострочная строка

x – используеются расширенные регулярные выражения.

Если '/' – ограничитель то начальное 'm' можно опустить. С помощью него в качестве ограничителя может быть любой символ кроме пробела.

PATTERN может содержать переменные которые будут интерполироваться (перекомпилироваться) каждый раз в момент вычисления.

Переменные $) и $| не интерполируются. Если вы хотите что бы такой шаблон интерполировался один раз – добавьте /o.

Это необходимо делать в циклах поиска для увеличения быстродействия однако если вы измените значение переменной Перл этого даже не заметит.

Если PATERN – нулевая строка то используется последнее регулярное выражение.

В скалярном контексте возвращается список элементы которого результаты выполнения выражений в скобках патерна ($1, $2, $3...).

Обратите внимание что первый елемент $1.

Пример:

$a = «/usr/local/perl/perl.bin»; # Анализируемая строка

Цель: Создать массив @dirs с именами директорий.

Решение:

Самый простой способ воспользоваться split('\/'), но в качестве примера используем скобки.

@dirs =~ m[/(\w*)/(\w*)/(\w*)/(\w*)]

Здесь 'm[' – использовать квадратные скобки как ограничители.

(\w*) – шаблон алфавитноцифровой последовательности.

В результате @dirs равен ('usr', 'local', 'perl')



q/строка/ 'строка'

Строка литералов. Не интерполируется. Внутри строки разрешается использовать \' или \\ для обозначения символов ' и \ .

Пример:

print q#Привет.#; # Результат Привет.

print 'O\'K'; # O'K



qq/строка/ «строка»

Интерполируемая строка.

Пример:

$var = 13;

print «\$var = $var»;

Результат:

$var = 13



qx/строка/ `строка`

Сначала строка интерполируется а потом выполняется как системная команда.

Пример:

print `date`;

Результат:

Thu Nov 14 13:36:49 MSK 1996


qw/строка/

Возвращает список элементы которого – слова строки разделенные пробелами.

Пример:

print qw/Построемся и спасемся!/; # ('Построемся','и','спасемся!')

Результат:

Построемсяиспасемся!

Часто применяется как:

use POSIX qw( setlocale localeconv )

@EXPORT = qw( proc1 var );



s/шаблон/подстрока/egimosx

Поиск по шаблону и в случае успеха замена подстрокой.

Возвращает количество произведенных подстановок иначе false (0). Если строка в которой ведестя поиск не указана (операторы =~ или != ) то используется переменная $_ .

Если в качестве раделителя '/' исрользовать одинарную кавычку (') то интерполяции не будет иначе можно применять переменные в шаблоне или подстроке.

Опции:

e – Расмматривать правую часть как выражение.

 – Глобальный поиск.

 – Без различия регистра букв

m – многосточная переменная

o – компилировать шаблон один раз

s – однострочная переменная

x – расширенное регулярное выражение

Разделитель '/' можно заменить на любой алфавитно-цифровой символ кроме пробела.

Пример:

$var = «12345»; # исходная строка

$var =~ s/1/0/; # Заменить '1' на '0'. Результат 02345

$var =~ s(5)(.); # Заменить '5' на '.' Результат 0234.

Здесь в качестве разделителя применены скобки поэтому подстрока

взята в две скобки.

$var =~ s/\d*/каламбур/; Заменить все цифры. Результат 'каламбур.'

$var =~ s/а/о/g; # Заменить все 'а' на 'о'. Результат 'коломбур.'

$var = «12 34»; # Новое значение

$var =~ s/(\d\d) (\d\d)/$2 $1/; # Поменять местами числа. Результат '34 12'.


tr/таблица1/таблица2/cds

y/таблица1/таблица2/cds

Замена всех символов из «таблица1» на соответсвующий символ из «таблица2». Результат – количество замен или стираний. Без оператора =~ или != операция выполняется с строкой $_. Для совместимости с программой sed вместо tr можно писать 'y'.

Опции:

c – дополнение «таблица1»

d – стереть найденные но не замененные символы.

s – «зжать» повторяющиеся замененные символы.

Если указана опция /dтаблица2 всегда интерпретируется как положено.

Другими словами если таблица2 короче чем таблица1 то символ из таблицы1 интерпретируется всегда. Если таблица2null то все символы строки остаются не изменненные. Это удобно для подсчета количества сиволов в строке определенного класса или для сжатия повторяющихся символов например пробелов.

Пример:

$s = «hello»; # Исходная строка

$s =~ tr/a-z/A-Z/; # Заменить малые буквы на большие. Результат

# 'HELLO'

$s = 'Hel....lo';

$s =~ tr/a-zA-z/_/c; # Заменить все не буквы на '_'

# Результат 'Hel____lo'

$s =~ tr/_/ /s; # Заменить '_' на ' ' и сжать.

# Результат 'Hel lo'

$s =~ tr/a-zA-Z /a-zA-Z/d; # Удалить все не буквы. Результат 'Hello'

Если один и тот же символ несколько раз указан в таблице1 то применяется только первая замена.


Операторы ввода-вывода.

В Перл существует несколько операторов ввода-вывода. Первый это скобки из символа '`' – акцента. Строка в этих скобках воспринимается как системная команда и результат ее действия возвращается как «псевдо» литерал. В скалярном контексте это строка содержащая весь результат, а в списковом – список элементы которого – строки результата.

Статус выполненой команды хранится в переменной $? .

Следующая команда ввода вывода выглядит как '<файл>'.

Вычисление <файл> приводит к чтению строки из файла. Обратите внимание что 'файл' здесь не имя файла, а указатель файла который создается функцией open(). В скалярном контексте читается одна строка вместе с символом '\n' – перевода строки, а в списковом весь файл читается в список элементы которого суть строки файла.

В случае обнаружения конца файла результат оператора не определен и воспринимается как false. Если не указана переменная результата то по умолчанию это $_. Указатель файла по умолчанию STDIN – стандартный ввод.

Пример:

while(<>) { print; }; # Прочитать и вывести весь файл STDIN

У оператора '<>' есть одна отличительная особенность. Если в командной строке нет никаких аргументов то читается стандартный ввод, если есть аргументы то они считаются именами файлов которые последовательно читаются.

Если в угловых скобках записана переменная то содержимое этой переменной считается именем указателя файла или ссылкой на указатель файла. Если такого указателя не существует то содержимое переменной воспринимается как шаблон имен файлов и результат – имена файлов на диске подходящих по шаблону.

Пример:

while(<*.pl>) { print;}; # То же что и ls *.pl

@files = <*>; # Массив @files содержит имена файлов в директории

но лучше сделать: @files = glob("*"); т.к. внутри скобок можно использовать переменные.


Слияние констант.

Как и С Перл выполняет возможные вычисления в период компиляции.

Так подстановка символов после '\' , операция конкатенации строк, арифметические выражения содержащие только одни константы, все это делается в момент компиляции что существенно увеличивает скорость выполнения программы.


Целочисленная арифметика.

По умолчанию Перл выполняет арифметику с плавающей запятой, но если вы укажете:

use integer;

то компилятор будет использовать целочисленную арифметику до конца текущего блока, хотя вложенный блок может это и отменить в своих пределах с помощью:

no integer;

Встроенные функции

Встроенные функции используются как термы выражений и подразделяются на две категории: списковые операторы и унарные операторы. Это влияет на их приоритет по отношению к оператору ',' – запятая. Списковые операторы могут именть множество (список) аргументов, а унарные только один. Таким образом запятая завершает аргументы унарного оператора и разделяет аргументы спискового.

Аргумент унарного оператора воспринимается обычно в скалярном контексте а спискового как в скалярном так и

списковом причем скалярные аргументы идут первыми. В дальнешем списковые аргументы мы будем обозначать словом 'LIST' это значит что функция имеет список аргументов разделенных запятой.

Аргументы функций можно заключать в круглые скобки и таким образом обозначать что «это функция» и приоритет не имеет значения иначе это списковый или унарный оператор с определенным фиксированным приоритетом. Пробел после имени функции и скобкой значения не имеет. Поэтому будьте внимательны!

Пример:

print 1 + 2 + 3; # результат 6

print(1+2)+3; # результат 3

print (1+2)+3; # опять 3

print (1+2+3); # 6

Если функция возвращает результат как в скалярном так и в списковом контексте то код выхода по ошибке – скаляр c неопределенным значением или пустой список.

Запомните правило:

Не существует общего правила преобразования списка в скаляр!

Каждый оператор и функция имеют свой вид значения в скалярном котексте.

Для одних это количество элементов из скалярного контекста. Для других первый элемент списка или последний или количество успешных операций. Каждый свое если вы специально не указываете.


Оператор '-X'.

-X указатель файла

-X выражение

-X

Проверка файла, где 'X' одно из ниже описанных значений.

Это унарный оператор с одним аргументом – либо именем файла либо указателем файла. Проверяет одно из условий. Если аргумент не указан то берется значение переменной $_. Для ключа -t STDIN.

Результат 1 если true и '' если false или неопределенное значение если файл не найден. Несмотря на странный вид это унарный оператор с соответсвующим приоритетом. Аргумент можно заключать в круглые скобки.

'X' имеет следующие значения:

-r Файл разрешен на чтение эффективным uid/gid

-w на запись -//-

-x исполнение -//-

-o принадлежит эффективному uid (идентификатор пользователя)

-R Файл разрешен на чтение реальным uid/gid

-W на запись -//-

-X исполнение -//-

-O принадлежит реальному uid

-e файл существует

-z пустой

-s не пустой

-f обычный текст

-d директория

-l символическая ссылка

-p pipes (конвейер)

-S socket (гнездо)

-b специальное блочное устройство

-c -//– символьное -//-

-t указатель на уст-во tty

-u установлен бит setuid

-g -//– setgid

-k -//– sticky

-T текстовой файл

-B двоичный

-M «возраст» файла в днях на момент старта скрипта

-A дней с последнего чтения

-C дней с последней модификации inode


abs выражение

Абсолютное значение выражения


accept NEWSOCKET, GENERICSOCKET

Окрыть новый сокет по внешнему запросу. Аналогично системному вызову accept(). Возвращает адрес или false в случае неудачи.


alarm секунды

Послать сигнал SIGALARM текущиму процессу по истечении указанного промежутка времени. Не допустимо делать несколько вызовов одновременно в одном промежутке времени.

Возвращает остаток времени предыдущего счетчика.


atan2 Y, X

Арктангес отношения Y к X в пределах от -pi до +pi.


bind сокит, имя

Назначить сетевой адрес сокиту. Подобно системному вызову bind. Возвращает true в случае успеха и false иначе.

Имя – пакетный адрес сокита.


binmode файл

Открыть файл для двоичного (binary) режима доступа.

В обычном режиме при вводе символы CR LF транслируются в LF, а при выводе LF транслируется в CR LF.


функция bless

bless ссылка, класс

bless ссылка

Данная функция определяет что объект указанный ссылкой принадлежит классу. Если класс не указан то он относится к текущему классу. Обычно это последний оператор в конструкторе объекта.

Необходимо обязательно указывать имя класса если определяемый объект может наследоваться классом-потомком.


функция caller

caller выражение

caller

Возвращает контекст вызова текущей подпрограммы.

В скалярном контексте true если это подпрограмма или процедура вызванная операторами eval() или require() и false – иначе.

В списковом это список ($package, $filename, $line)

где

$package – имя пакета

$filename – имя файла пакета

$line – номер строки откуда был сделан вызов.

Если указано выражение то возвращается список:

($package, $filename, $line, $subroutine, $hasargs, $wantargs)

Выражение определяет «глубину» вложенности просмотра стека вызовов.

$subroutine – имя подпрограммы

$hasargs – имеющиеся аргументы

$wantargs – необходимые аргументы


  • Страницы:
    1, 2, 3, 4, 5, 6