Znajdź i zamień wartości ciągów na liście

153

Mam tę listę:

words = ['how', 'much', 'is[br]', 'the', 'fish[br]', 'no', 'really']

To, co chciałbym, to zastąpić [br]jakąś fantastyczną wartością podobną do, <br />a tym samym uzyskać nową listę:

words = ['how', 'much', 'is<br />', 'the', 'fish<br />', 'no', 'really']
Eric Herlitz
źródło

Odpowiedzi:

274
words = [w.replace('[br]', '<br />') for w in words]

Są to tak zwane listy składane .

sberry
źródło
5
Dokonując porównania między tą metodą rozumienia listy a metodą mapy (opublikowaną przez @Anthony Kong), ta metoda listy była około 2x szybsza. Pozwoliło to również na wstawienie wielu zamienników do tego samego wezwania, np.resname = [name.replace('DA', 'ADE').replace('DC', 'CYT').replace('DG', 'GUA').replace('DT', 'THY') for name in ncp.resname()]
Steven C. Howell
1
@sberry Mam listę, w ['word STRING', 'word_count BIGINT', 'corpus STRING', 'corpus_date BIGINT']której próbuję zastąpić 'pustą, ale to nie działa. jak możemy to zastąpić używając tego?
Sandeep Singh
Co się stanie, jeśli jeden z elementów jest liczbą zmiennoprzecinkową / całkowitą?
Patriots299
32

Możesz użyć np .:

words = [word.replace('[br]','<br />') for word in words]
houbysoft
źródło
2
@macetw W rzeczywistości pierwsza odpowiedź.
CodeIt
patrząc na znacznik czasu wydaje się, że obaj odpowiedzieli w tym samym czasie, może ten jest spóźniony o jakiś ułamek sekundy ...
maksbd19
31

Oprócz rozumienia list, możesz spróbować map

>>> map(lambda x: str.replace(x, "[br]", "<br/>"), words)
['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
Anthony Kong
źródło
15

Jeśli zastanawiasz się nad wydajnością różnych podejść, oto kilka terminów:

In [1]: words = [str(i) for i in range(10000)]

In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words]
100 loops, best of 3: 2.98 ms per loop

In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words)
100 loops, best of 3: 5.09 ms per loop

In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words)
100 loops, best of 3: 4.39 ms per loop

In [5]: import re

In [6]: r = re.compile('1')

In [7]: %timeit replaced = [r.sub('<1>', w) for w in words]
100 loops, best of 3: 6.15 ms per loop

jak widać w przypadku takich prostych wzorców akceptacja listy jest najszybsza, ale spójrz na poniższe:

In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words]
100 loops, best of 3: 8.25 ms per loop

In [9]: r = re.compile('(1|324|567)')

In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words]
100 loops, best of 3: 7.87 ms per loop

To pokazuje, że w przypadku bardziej skomplikowanych podstawień wstępnie skompilowany reg-exp (jak w 9-10) może być (znacznie) szybszy. To naprawdę zależy od twojego problemu i najkrótszej części reg-exp.

Jörn Hees
źródło
3

Przykład z pętlą for (wolę listy składane).

a, b = '[br]', '<br />'
for i, v in enumerate(words):
    if a in v:
        words[i] = v.replace(a, b)
print(words)
# ['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
Waket Zheng
źródło