Python - Отдалечени файлове

Съдържание

Python ни позволява да работим с отдалечени файлове, може би това не звучи логично по този начин, но отдалечените файлове в този случай не са нищо повече от заявки към уеб страници от нашата програма Python, причината за това може да бъде от запитване до REST уеб услуги които ни позволяват да получим стойности чрез ПОЛУЧАВАЙТЕ или директно запитвайте страници и манипулирайте тяхното съдържание.

За да постигнем това, ще използваме някои от многото библиотеки, които предлага Python за работа с мрежи, като по този начин се премахват техническите пречки и се концентрира само върху това колко важно е това в нашата логика за програмиране.

urllib и urllib2
Тези две книжарници urllib Y urllib2 Те ни позволяват да вършим работата по достъпа до файлове през мрежата, сякаш са в нашата локална среда, чрез просто извикване на функция, това може да ни служи за много неща, например, че можем да използваме мрежа и с нейното съдържание правете отчети в нашата програма какво можем да намерим в нея.

Тези две библиотеки са сходни, разликата им е в това urllib2 може да е малко по -сложно, където ако просто искаме да направим заявка без допълнителни последици, можем да използваме urllib, но ако искаме да извършим някакъв процес на удостоверяване или да използваме бисквитки, тогава urllib2 може да е правилният избор за нашата програма.

Тъй като теоретично знаем от какво се нуждаем и защо се нуждаем от него, нека видим малък пример за код, за да ни стане ясно какво можем да направим, в следващия пример ще отворим уеб от нашата програма и след това чрез регулярни изрази ще извлечем връзка към съдържанието му за това, което ще използваме urllib:

 >>> от urllib импортиране urlopen >>> webpage = urlopen ('http://www.python.org') >>> import re >>> text = webpage.read () >>> m = re.search ( 'Урок', текст, re.IGNORECASE) >>> m.group (1) 

Отиваме стъпка по стъпка, първо от библиотеката urllib, която импортираме urlopen, тогава създаваме променлива, наречена уеб страница който е този, който ще съдържа резултата от urlopen Какво ще правим с официалния уебсайт на Python, с това вече импортираме повторно За да работим с регулярни изрази, казваме, че текстът е променливата, която ще съдържа съдържанието на четенето на страницата, правим търсене с регулярен израз и накрая групираме резултата, който трябва да отпечата следното:

http://docs.python.org/

Това е благодарение на метода urlopenТова, което правите, е, че ни позволява да работим с уеб страницата, сякаш е файлов обект, по този начин можем да приложим много от функциите, които можем да използваме с този тип обекти, дори ако искаме, можем да изтеглим страницата и го работете от нашия местен по много лесен начин, като използвате метода urlretrieve както следва:

 urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')
Единственото нещо, което правим, е да предадем като втори параметър пътя в нашата локална среда, където файлът с копието на страницата трябва да бъде записан без особени затруднения.

С това завършваме този урок, тъй като виждаме, че извършването на по -сложна работа, като например използването на страници в нашите програми е доста просто благодарение на библиотеките на Python.

Хареса ли ви и помогнахте на този урок?Можете да възнаградите автора, като натиснете този бутон, за да му дадете положителна точка
wave wave wave wave wave