Jak wykreślić pionową linię na wykresie szeregów czasowych w Pandach?

81
  • Jak wykreślić pionową linię ( vlines) na wykresie serii Pandas?
  • Używam Pand do kreślenia środków toczenia itp. I chciałbym oznaczyć ważne pozycje linią pionową.
  • Czy można użyć vlineslub czegoś podobnego, aby to osiągnąć?
  • W tym przypadku oś x to datetime.
aetodd
źródło

Odpowiedzi:

110
plt.axvline(x_position)

To trwa standardowy wykres opcji formatowania ( linestlye, color, ect)

(doc)

Jeśli masz odniesienie do swojego axesobiektu:

ax.axvline(x, color='k', linestyle='--')
tacaswell
źródło
3
Tak, masz dostęp do obiektu osi ax = s.plot (), gdzie s to pandy.Series
joao
42

Jeśli masz oś czasu i masz Pandy zaimportowane jako pd, możesz użyć:

ax.axvline(pd.to_datetime('2015-11-01'), color='r', linestyle='--', lw=2)

W przypadku wielu linii:

xposition = [pd.to_datetime('2010-01-01'), pd.to_datetime('2015-12-31')]
for xc in xposition:
    ax.axvline(x=xc, color='k', linestyle='-')
zbinsd
źródło
Mam 3-dniową fabułę i jedyne co zrobiłem to: xposition = [pd.to_datetime('01/04/2016'), pd.to_datetime('02/04/2016'),pd.to_datetime('03/04/2016')]wtedy for xc in xposition: ax.axvline(x=xc, color='k', linestyle='-'). I mam: ValueError: ordinal must be >= 1.. Co jest nie tak?
FaCoffee
@FaCoffee, twoje daty są w innym formacie niż przykład podany w odpowiedzi, chociaż nie widzę, jak to by to zmieniło.
RufusVS
Chciałbym wykreślić pionową linię na wykresie kolumny szeregów czasowych dla każdego dnia. Czy proszę o pomoc?
Ikbel benab
12

Funkcja wykresu DataFrame zwraca AxesSubplotobiekt i na nim możesz dodać dowolną liczbę linii. Spójrz na przykładowy kod poniżej:

%matplotlib inline

import pandas as pd
import numpy as np

df = pd.DataFrame(index=pd.date_range("2019-07-01", "2019-07-31"))  # for sample data only
df["y"] = np.logspace(0, 1, num=len(df))  # for sample data only

ax = df.plot()
# you can add here as many lines as you want
ax.axhline(6, color="red", linestyle="--")
ax.axvline("2019-07-24", color="red", linestyle="--")

wprowadź opis obrazu tutaj

Roman Orac
źródło
3

matplotlib.pyplot.vlines

  • W przypadku szeregów czasowych daty na osi muszą być właściwymi obiektami daty i godziny , a nie ciągami.
  • Pozwala na jedną lub wiele lokalizacji
  • ymin& ymaxsą określone jako konkretna wartość y, a nie jako procentylim
  • Jeśli odwołujesz axessię do czegoś podobnego fig, axes = plt.subplots(), zmień plt.xlinesnaaxes.xlines

plt.plot() & sns.lineplot()

from datetime import datetime
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns  # if using seaborn

plt.style.use('seaborn')  # these plots use this style

# configure synthetic dataframe
df = pd.DataFrame(index=pd.bdate_range(datetime(2020, 6, 8), freq='1d', periods=500).tolist())
df['v'] = np.logspace(0, 1, num=len(df))

# plot
plt.plot('v', data=df, color='magenta')

y_min = df.v.min()
y_max = df.v.max()

plt.vlines(x=['2020-07-14', '2021-07-14'], ymin=y_min, ymax=y_max, colors='purple', ls='--', lw=2, label='vline_multiple')
plt.vlines(x=datetime(2021, 9, 14), ymin=4, ymax=9, colors='green', ls=':', lw=2, label='vline_single')
plt.legend(bbox_to_anchor=(1.04, 0.5), loc="center left")
plt.show()

wprowadź opis obrazu tutaj

df.plot()

df.plot(color='magenta')

ticks, _ = plt.xticks()
print(f'Date format is pandas api format: {ticks}')

y_min = df.v.min()
y_max = df.v.max()

plt.vlines(x=['2020-07-14', '2021-07-14'], ymin=y_min, ymax=y_max, colors='purple', ls='--', lw=2, label='vline_multiple')
plt.vlines(x='2020-12-25', ymin=y_min, ymax=8, colors='green', ls=':', lw=2, label='vline_single')
plt.legend(bbox_to_anchor=(1.04, 0.5), loc="center left")
plt.show()

wprowadź opis obrazu tutaj

wersje pakietów

import matplotlib as mpl

print(mpl.__version__)
print(sns.__version__)
print(pd.__version__)

[out]:
3.3.1
0.10.1
1.1.0

Trenton McKinney
źródło
Jak dodałeś szare tło z białą siatką? Nie mogę tego
rozgryźć
1
plt.style.use('seaborn')
Trenton McKinney