Введение в Python - [14]

Шрифт
Интервал

.

Обработка исключительных ситуаций в Python


Published: 22 September 2015


Исключительной называется ситуация, в которой программа ведет себя не так, как предполагал разработчик. Причиной такой ситуации может быть как недоброкачественная работа программиста, так и недопонимание пользователя или умышленные действия взломщика.

Возьмем в качестве примера следующий скрипт. Программа спрашивает у пользователя число и делит сто на это число:


>1 | a = float(input("Введите число "))

>2 | print (100 / a)


Если пользователь введет информацию, которую мы от него ожидаем, то все сработает как нужно.



Вот что произойдет просто потому, что мы не учли, что на ноль делить нельзя.



А вот что случится, если кто-то специально попытается поломать программу.



Чем сложнее программа, тем больше у нее уязвимых мест, которые вам придется учитывать в процессе разработки. Python предлагает следующий механизм обработки исключительных ситуаций.

Блок try-except в Python

Уязвимый код заключается в блок try, после которого следует блок except, которому может задаваться возможная ошибка и реакция на нее:

>1 | try:

>2 | a =float(input("Введите число: "))

>3 | except ValueError:

>4 | print ("Это не число!")


В данном примере программа пытается конвертировать информацию введенную пользователем в тип float, если же при этом возникнет ошибка класса ValueError, то выводится строка "This is not a valid number". В блоке except мы можем задать те классы ошибок на которые данный блок должен сработать, если мы не укажем ожидаемый класс ошибок, то блок будет реагировать на любую возникшую ошибку.



Блок try может содержать неограниченное количество блоков except:


>1 | try:

>2 | a =float(input ("Введите число: ")

>3 | print (100 / a)

>4 | except ValueError:

>5 | print ("Это не число")

>6 | except ZeroDivisionError:

>7 | print ("На ноль делить нельзя")




Кроме того мы можем добавить пустой блок except, который будет срабатывать на непредвиденную выше ошибку. Пустой блок except всегда должен идти последним:


>1 | try:

>2 | a =float(input ("Введите число: ")

>3 | print (100 / a)

>4 | except ValueError:

>5 | print ("Это не число")

>6 | except ZeroDivisionError:

>7 | print ("На ноль делить нельзя")

>8 | except:

>9 | print ("Неожиданная ошибка.")


Блок else в блоке try-except в Python

Блоку except можно добавить необязательный блок else, который сработает в случае, если программа выполнилась без ошибок:


> 1 | try:

> 2 | a =float(input ("Введите число: ")

> 3 | print (100 / a)

> 4 | except ValueError:

> 5 | print ("Это не число")

> 6 | except ZeroDivisionError:

> 7 | print ("На ноль делить нельзя")

> 8 | except:

> 9 | print ("Неожиданная ошибка.")

>10 | else:

>11 | print ("Код выполнился без ошибок")


В результате, мы получим следующее.



Блок finally в Python

Также у блока except есть еще один необязательный блок finally, который сработает независимо от того, выполнился код с ошибками или без:


> 1 | try:

> 2 | a =float(input ("Введите число: ")

> 3 | print (100 / a)

> 4 | except ValueError:

> 5 | print ("Это не число")

> 6 | except ZeroDivisionError:

> 7 | print ("На ноль делить нельзя")

> 8 | except:

> 9 | print ("Неожиданная ошибка.")

>10 | else:

>11 | print ("Код выполнился без ошибок")

>12 | finally:

>13 | print ("Я выполняюсь в любом случае!")




Таким образом, используя обработку исключительных ситуаций, вы можете защитить программу от взлома, непредвиденного поведения и в будущем получить детальную информацию по логическим ошибкам, содержащимся в ней.

HTML парсер на Python


Published: 08 April 2015


Учитывая современное развитие Интернета, было бы кощунством не написать приложение, взаимодействующее со всемирной паутиной. Сегодня мы напишем простенький html-парсер на Python. Наше приложение будет читать код указанной страницы сайта и сохранять все ссылки в ней в отдельный файл. Это приложение может помочь SEO-аналитикам и веб-разработчикам.

Писать будем на Python 3, в котором есть встроенный класс для html-парсера из модуля html.parser


>| from html.parser import HTMLParser


Так же нам понадобится функция urlopen из модуля urllib


>| from urllib.request import urlopen


Именно функция urlopen будет получать исходный код указанной странички.

Перегрузка класса HTMLParser

Наша задача таким образом перегрузить функционал существующего класса HTMLParser, чтобы он соответствовал нашей задаче.


>| class MyHTMLParser(HTMLParser):

>| def __init__(self, site_name, * args, * * kwargs):

>| # список ссылок

>| self.links = []

>| # имя сайта

>| self.site_name = site_name

>| # вызываем __init__ родителя

>| super().__init__( * args, * * kwargs)

>| # при инициализации "скармливаем" парсеру содержимое страницы

>| self.feed(self.read_site_content())

>| # записываем список ссылок в файл

> self.write_to_file()


Базовый класс HTMLParser имеет несколько методов, нас в данном случае интересуют метод handle_start_tag. Этот метод вызывается каждый раз, когда наш парсер встречает в тексте октрывающий html-тэг.


>| def handle_starttag(self, tag, attrs):

>| # проверяем является ли тэг тэгом ссылки

>| if tag == 'a':

>| # находим аттрибут адреса ссылки


Рекомендуем почитать
Изучаем Java EE 7

Java Enterprise Edition (Java EE) остается одной из ведущих технологий и платформ на основе Java. Данная книга представляет собой логичное пошаговое руководство, в котором подробно описаны многие спецификации и эталонные реализации Java EE 7. Работа с ними продемонстрирована на практических примерах. В этом фундаментальном издании также используется новейшая версия инструмента GlassFish, предназначенного для развертывания и администрирования примеров кода. Книга написана ведущим специалистом по обработке запросов на спецификацию Java EE, членом наблюдательного совета организации Java Community Process (JCP)


Pro Git

Разработчику часто требуется много сторонних инструментов, чтобы создавать и поддерживать проект. Система Git — один из таких инструментов и используется для контроля промежуточных версий вашего приложения, позволяя вам исправлять ошибки, откатывать к старой версии, разрабатывать проект в команде и сливать его потом. В книге вы узнаете об основах работы с Git: установка, ключевые команды, gitHub и многое другое.В книге рассматриваются следующие темы:основы Git;ветвление в Git;Git на сервере;распределённый Git;GitHub;инструменты Git;настройка Git;Git и другие системы контроля версий.


Java 7

Рассмотрено все необходимое для разработки, компиляции, отладки и запуска приложений Java. Изложены практические приемы использования как традиционных, так и новейших конструкций объектно-ориентированного языка Java, графической библиотеки классов Swing, расширенной библиотеки Java 2D, работа со звуком, печать, способы русификации программ. Приведено полное описание нововведений Java SE 7: двоичная запись чисел, строковые варианты разветвлений, "ромбовидный оператор", NIO2, новые средства многопоточности и др.


Фундаментальные алгоритмы и структуры данных в Delphi

Книга "Фундаментальные алгоритмы и структуры данных в Delphi" представляет собой уникальное учебное и справочное пособие по наиболее распространенным алгоритмам манипулирования данными, которые зарекомендовали себя как надежные и проверенные многими поколениями программистов. По данным журнала "Delphi Informant" за 2002 год, эта книга была признана сообществом разработчиков прикладных приложений на Delphi как «самая лучшая книга по практическому применению всех версий Delphi».В книге подробно рассматриваются базовые понятия алгоритмов и основополагающие структуры данных, алгоритмы сортировки, поиска, хеширования, синтаксического разбора, сжатия данных, а также многие другие темы, тесно связанные с прикладным программированием.


Питон — модули, пакеты, классы, экземпляры

Python - объектно-ориентированный язык сверхвысокого уровня. Python, в отличии от Java, не требует исключительно объектной ориентированности, но классы в Python так просто изучить и так удобно использовать, что даже новые и неискушенные пользователи быстро переходят на ОО-подход.


Как пасти котов. Наставление для программистов, руководящих другими программистами

«Как пасти котов» – это книга о лидерстве и руководстве, о том, как первое совмещать со вторым. Это, если хотите, словарь трудных случаев управления IT-проектами. Программист подобен кошке, которая гуляет сама по себе. Так уж исторически сложилось. Именно поэтому так непросто быть руководителем команды разработчиков. Даже если вы еще месяц назад были блестящим и дисциплинированным программистом и вдруг оказались в роли менеджера, вряд ли вы знаете, с чего надо начать, какой выбрать стиль руководства, как нанимать и увольнять сотрудников, проводить совещания, добиваться своевременного выполнения задач.