“Utwórz Spark DataFrame z pandy” Kod odpowiedzi

Pandy danych do zapisu


from pyspark.sql import SparkSession
#Create PySpark SparkSession
spark = SparkSession.builder \
    .master("local[1]") \
    .appName("SparkByExamples.com") \
    .getOrCreate()
#Create PySpark DataFrame from Pandas
sparkDF=spark.createDataFrame(pandasDF) 
sparkDF.printSchema()
sparkDF.show()

#Outputs below schema & DataFrame

root
 |-- Name: string (nullable = true)
 |-- Age: long (nullable = true)

+------+---+
|  Name|Age|
+------+---+
| Scott| 50|
|  Jeff| 45|
|Thomas| 54|
|   Ann| 34|
+------+---+
Sore Stork

Utwórz Spark DataFrame z pandy

import numpy as np
import pandas as pd

# Enable Arrow-based columnar data transfers
spark.conf.set("spark.sql.execution.arrow.enabled", "true")

# Generate a pandas DataFrame
pdf = pd.DataFrame(np.random.rand(100, 3))

# Create a Spark DataFrame from a pandas DataFrame using Arrow
df = spark.createDataFrame(pdf)
Makstar

Odpowiedzi podobne do “Utwórz Spark DataFrame z pandy”

Pytania podobne do “Utwórz Spark DataFrame z pandy”

Więcej pokrewnych odpowiedzi na “Utwórz Spark DataFrame z pandy” w Python

Przeglądaj popularne odpowiedzi na kod według języka

Przeglądaj inne języki kodu