Akwụkwọ maka Re modul maka Python 3 na . Re modul maka okwu mgbe niile

Okwu oge niile bụ akụkụ ama ama nke ihe fọrọ nke nta ka ọ bụrụ asụsụ mmemme ọ bụla. Ha na-enyere gị aka ịnweta ozi ị chọrọ ngwa ngwa. Karịsịa, a na-eji ha eme ihe mgbe ọ dị mkpa iji hazie ederede. Python na-abịa na modul pụrụ iche na ndabara. re, nke na-ahụ maka ịrụ ọrụ na okwu mgbe niile.

Taa, anyị ga-ekwu n'ụzọ zuru ezu banyere ihe ọ bụ n'ozuzu, otú e si arụ ọrụ na ha na otú modul re ga-enyere aka.

Okwu mgbe nile: mmeghe

Kedu ihe eji ekwu okwu mgbe niile? Fọrọ nke nta niile. Dịka ọmụmaatụ, ndị a:

  1. Ngwa weebụ chọrọ nkwado ederede. Otu ihe atụ bụ ndị ahịa ozi ịntanetị.
  2. Ọrụ ọ bụla ọzọ metụtara ederede, ọdụ data na ihe ndị ọzọ.

Tupu anyị amalite ịkọwapụta syntax, anyị kwesịrị ịghọta n'ụzọ zuru ezu ụkpụrụ ndị bụ isi nke ịrụ ọrụ nke ụlọ akwụkwọ ahụ re na n'ozuzu, ihe na-adịkarị mma banyere ya. Anyị ga-enyekwa ihe atụ sitere na ezigbo omume, ebe anyị ga-akọwa usoro nke ojiji ha. Ị nwere ike ịmepụta template dị otú ahụ, kwesịrị ekwesị maka ịrụ ọrụ dịgasị iche iche na ederede.

Kedu ihe ndebiri n'ọba akwụkwọ Re?

Site na ya, ị nwere ike ịchọ ozi nke ụdị dị iche iche, nweta ozi kwekọrọ na ha, iji mee ka ọrụ ndị ọzọ na-agbanwe agbanwe. Na, n'ezie, iji hazie data a.

Dịka ọmụmaatụ, were template a: s+. Ọ pụtara agwa oghere ọ bụla. Ọ bụrụ na ị gbakwunye akara gbakwunyere na ya, nke a pụtara na ụkpụrụ ahụ gụnyere ihe karịrị otu oghere. O nwedịrị ike dakọọ mkpụrụedemede taabụ ndị a na-akpọ t+.

Tupu iji ha, ịkwesịrị ibubata ọba akwụkwọ Re. Mgbe nke ahụ gasịrị, anyị na-eji iwu pụrụ iche chịkọta template. A na-eme nke a na nzọụkwụ abụọ.

>>> mbubata re

>>> regex = re.compile('s+')

Kpọmkwem, koodu a na-arụ ọrụ nke ịchịkọta template nwere ike iji. ọmụmaatụ, ịchọ oghere (otu ma ọ bụ karịa).

Nweta ozi dị iche iche site na eriri dị iche iche site na iji okwu oge niile

Ka e were ya na anyị nwere mgbanwe nwere ozi ndị a.

>>> ederede = """100 INF Informatics

213 Mat mgbakọ na mwepụ  

156 ENG English»»

O nwere nkuzi nkuzi atọ. Nke ọ bụla n'ime ha nwere akụkụ atọ - nọmba, koodu na aha. Anyị na-ahụ na etiti etiti okwu ndị a dị iche. Kedu ihe ị ga-eme iji mebie ahịrị a n'ime nọmba na okwu dị iche iche? Enwere ụzọ abụọ iji nweta ebumnuche a:

  1. kpọọ ọrụ re.gbawaa.
  2. tinye ọrụ Kewaa n'ihi na regex.

Nke a bụ ọmụmaatụ nke iji syntax nke usoro nke ọ bụla maka mgbanwe anyị.

>>> re.ekewa ('s+', ederede)  

# ma ọ bụ

>>> regex.split(ederede)

Mpụta: ['100', 'INF', 'Computer Science', '213', 'MAT', 'Math', '156', 'ENG', 'Bekee']

N'ozuzu, a pụrụ iji ụzọ abụọ ahụ mee ihe. Mana ọ dị nfe n'ezie iji nkwupụta oge niile kama iji ọrụ ahụ ọtụtụ oge. re.gbawaa.

Ịchọta egwuregwu nwere ọrụ atọ

Ka anyị kwuo na anyị kwesịrị iwepụta naanị ọnụọgụ na eriri. Gịnị ka e kwesịrị ime maka nke a?

re.findall()

Nke a bụ ikpe ojiji maka ọrụ ahụ findall(), nke, yana okwu oge niile, na-enye gị ohere iwepụta ọnọdụ nke otu nọmba ma ọ bụ karịa na mgbanwe ederede.

>>> bipụta (ederede)  

100 INF Informatics

213 Mat mgbakọ na mwepụ  

156 ENG English

>>> regex_num = mkpọkọta('d+')  

>>> regex_num.findall(ederede)  

['100', '213', '156']

Tinyere akara d, anyị jiri ndebiri na-egosi kpamkpam uru ọnụọgụ ọ bụla dị na mgbanwe ma ọ bụ ederede. Ma ebe anyị gbakwunyere otu + n'ebe ahụ, nke a pụtara na ọ dịkarịa ala otu ọnụọgụ ga-adịrịrị. 

Ịnwekwara ike iji akara * iji kọwaa na ọnweghị ọnụọgụ ọnụọgụ maka ịchọta egwuregwu.

Ma n'ọnọdụ anyị, ebe ọ bụ na anyị na-eji +, anyị na-amịpụta findall() 1 ma ọ bụ karịa dijitalụ nhọpụta nke ọmụmụ si na ederede. Ya mere, n'ọnọdụ anyị, okwu mgbe niile na-arụ ọrụ dị ka ntọala maka ọrụ ahụ.

re.search() vs dakọtara()

Dị ka ị nwere ike ịkọ site na aha ọrụ, nke mbụ na-achọ otu egwuregwu na ederede. Ajụjụ: Gịnị bụ ọdịiche dị n'etiti Findall? Isi ihe bụ na ọ na-eweghachi otu ihe dabara na ụkpụrụ ahụ, ọ bụghị usoro niile achọpụtara n'ụdị ndepụta, dị ka ọrụ gara aga.

N'aka nke ya, ọrụ re.match na-eme otu ihe ahụ. Naanị syntax dị iche. A ghaghị itinye template ahụ na mmalite. 

Ka anyị were ihe atụ gosiri nke a.

>>> # mepụta mgbanwe na ederede

>>> ederede2 = «»» INF Informatics

213 Mat mgbakọ na mwepụ 156 ″»  

>>> # chịkọta regex wee chọọ usoro

>>> regex_num = mkpọkọta('d+')  

>>> s = regex_num.search(ederede2)  

>>> bipụta ('Ntụziaka mbụ:', s.start())  

>>> bipụta ('Ntụziaka ikpeazụ:', s.end())  

>>> ebipụta (ederede2[s.start():s.end()]) 

Ndekọ mbụ: 17 

Ndekọ ikpeazụ: 20

213

Ọ bụrụ na ịchọrọ ịnweta nsonaazụ yiri ya n'ụzọ dị iche, ị nwere ike iji ọrụ ahụ otu().

Jiri ọba akwụkwọ Re dochie akụkụ nke ederede

Iji dochie ederede, jiri ọrụ ahụ re.sub(). Ka e were ya na ndepụta ọmụmụ anyị agbanweela ntakịrị. Anyị na-ahụ na mgbe ọ bụla dijitalụ uru anyị nwere taabụ. Ọrụ anyị bụ ijikọta usoro a niile n'otu ahịrị. Iji mee nke a, anyị kwesịrị dochie okwu s+ agafe 

Ederede izizi bụ:

# mepụta mgbanwe na ederede

>>> ederede = """100 INF t Informatics

213 MAT t Math  

156 ENG t English»»  

>>> bipụta (ederede)  

100 Ozi Science kọmputa

213 MAT Mathematics  

156 ENG English

Iji rụọ ọrụ achọrọ, anyị na-eji ahịrị koodu ndị a.

# jiri 1 dochie otu oghere ma ọ bụ karịa

>>> regex = re.compile('s+')  

>>> bipụta (regex.sub('', ederede))  

N'ihi ya, anyị nwere otu ahịrị. 

101 COM Kọmputa 205 MAT mgbakọ na mwepụ 189 ENG bekee

Ugbu a tụlee nsogbu ọzọ. Anyị anaghị eche ọrụ nke itinye oghere ihu. Ọ dị anyị mkpa karịa ka aha akwụkwọ niile malite n'ahịrị ọhụrụ. Iji mee nke a, a na-eji okwu ọzọ na-agbakwụnye ahịrị ọhụrụ na ewepu. Kedu ụdị okwu a bụ?

Library Re na-akwado atụmatụ dị ka ndakọrịta adịghị mma. Ọ dị iche na nke a kapịrị ọnụ n'ihi na o nwere ebe mkpu tupu slash. Ya bụ, ọ bụrụ na anyị kwesịrị ịwụpụ agwa ọhụrụ ahịrị, mgbe ahụ anyị kwesịrị ide !n kama n.

Anyị na-enweta koodu na-esonụ.

# wepu oghere niile ewezuga ahịrị ọhụrụ  

>>> regex = re.compile('((?!n)s+)')  

>>> bipụta (regex.sub('', ederede))  

100 INF Informatics

213 Mat mgbakọ na mwepụ  

156 ENG English

Kedu ihe bụ otu okwu mgbe niile?

Site n'enyemaka nke otu ndị na-ekwu okwu mgbe niile, anyị nwere ike nweta ihe ndị a chọrọ n'ụdị ihe dị iche iche, ọ bụghị n'otu akara. 

Ka e were ya na anyị kwesịrị ịnweta ọnụọgụ akwụkwọ, koodu na aha abụghị n'otu ahịrị, kama dị ka ihe dị iche iche. Iji rụchaa ọrụ ahụ, ị ​​ga-achọ ide ọtụtụ ahịrị ahịrị koodu na-enweghị isi. 

N'ezie, ọrụ ahụ nwere ike ime ka ọ dị mfe. Ị nwere ike chịkọta ndebiri maka ndenye niile wee kọwaa naanị data ịchọrọ inweta site na brackets.

A ga-enwe obere ahịrị ahịrị. 

# mepụta otu ndebiri ederede ma wepụta ha

>>> usoro_ụkpụrụ = '([0-9]+)s*([A-ZY]{3})s*([a-zA-ZoY]{4,})'  

>>> re.findall(course_pattern, text)  

[('100', 'INF', 'Computer Science'), ('213', 'MAT', 'Math'), ('156', 'ENG', 'Bekee')]

Echiche nke "anyaukwu" dakọtara

Site na ọkọlọtọ, a na-ahazi okwu oge niile iji wepụta oke data dabara adaba. Na ọbụna ma ọ bụrụ na ị chọrọ nke ukwuu obere.

Ka anyị leba anya na koodu HTML ebe anyị kwesịrị inweta mkpado ahụ.

>>> ederede = "Ihe Nlereanya nke Nkwukọrịta Nkwupụta Oge Oge nke anyaukwu"  

>>> re.findall('', ederede)  

['Ihe Nlereanya nke Mmekọ Nkwupụta Okwu Oge Anyaukwu']

Kama iwepụta naanị otu mkpado, Python nwetara eriri ahụ dum. Ọ bụ ya mere e ji akpọ ya anyaukwu.

Kedu ihe ị ga-eme iji nweta naanị mkpado? N'okwu a, ịkwesịrị iji mmetụ umengwụ. Iji kọwapụta ụdị okwu ahụ, a na-agbakwunye akara ajụjụ na njedebe nke ụkpụrụ ahụ.

Ị ga-enweta koodu na-esonụ na mmepụta nke onye ntụgharị okwu.

>>> re.findall('', ederede)  

[","]

Ọ bụrụ na achọrọ ka ọ nweta naanị ihe mbụ zutere, mgbe ahụ, a na-eji usoro ahụ chọọ ().

re.search('', ederede).otu()  

"

Mgbe ahụ, naanị mkpado mmeghe ka a ga-achọta.

Ụdị Nkwupụta ewu ewu

Nke a bụ tebụl nwere usoro okwu oge niile a na-ejikarị.

Akwụkwọ maka Re modul maka Python 3 na . Re modul maka okwu mgbe niile

mmechi

Anyị atụlewo naanị ụzọ ndị kachasị mkpa maka ịrụ ọrụ na okwu mgbe niile. N'ọnọdụ ọ bụla, ị hụla otú ha si dị mkpa. Na ebe a, ọ dịghị ihe dị iche ma ọ dị mkpa ka ihichapụ ihe odide dum ma ọ bụ iberibe ya n'otu n'otu, ma ọ dị mkpa iji nyochaa post na netwọk mmekọrịta ma ọ bụ na-anakọta data iji hazie ya ma emechaa. Ikwu okwu mgbe nile bụ ihe enyemaka a pụrụ ịdabere na ya n'okwu a.

Ha na-enye gị ohere ịrụ ọrụ dịka:

  1. Na-akọwapụta usoro nke data, dị ka adreesị ozi-e ma ọ bụ nọmba ekwentị.
  2. Inweta eriri na kewaa ya n'ime ọtụtụ obere eriri.
  3. Jiri ederede rụọ ọrụ dị iche iche, dị ka ịchọ, wepụ ozi dị mkpa, ma ọ bụ dochie akụkụ nke mkpụrụedemede.

Okwu mgbe niile na-enyekwa gị ohere ịrụ ọrụ na-adịghị mkpa. Na ilele anya mbụ, ịmụta sayensị a adịghị mfe. Ma na omume, a na-ahazi ihe niile, ya mere o zuru ezu iji chọpụta ya otu ugboro, mgbe nke a gasịrị, a pụrụ iji ngwá ọrụ a mee ihe ọ bụghị nanị na Python, kamakwa na asụsụ mmemme ọ bụla. Ọbụna Excel na-eji okwu oge niile na-eme ka nhazi data rụọ ọrụ. Ya mere ọ bụ mmehie ịghara iji ngwá ọrụ a.

Nkume a-aza