معرفی شرکت ها

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A library that helps you build dlt pipelines by side stepping the dlt library and making your code interactive

ویژگی	مقدار
سیستم عامل	-
نام فایل	dlt-sidestep-0.0.8
نام	dlt-sidestep
نسخه کتابخانه	0.0.8
نگهدارنده	[]
ایمیل نگهدارنده	[]
نویسنده	Michael Gardner
ایمیل نویسنده	gardnmi@gmail.com
آدرس صفحه اصلی	-
آدرس اینترنتی	https://pypi.org/project/dlt-sidestep/
مجوز	-

### Installation pip install in your Databricks Notebook ```python %pip install dlt_sidestep ``` ### Example Usage **Note**: You must define a `pipeline_id` variable as `spark.conf.get("pipelines.id", None)` **Note**: You must define a `g` variable as `globals()` ` ```python from pyspark.sql.functions import * from pyspark.sql.types import * from dlt_sidestep import SideStep pipeline_id = spark.conf.get("pipelines.id", None) g = globals() if pipeline_id: import dlt json_path = "/databricks-datasets/wikipedia-datasets/data-001/clickstream/raw-uncompressed-json/2015_2_clickstream.json" step = """ @dlt.create_table( comment="The raw wikipedia click stream dataset, ingested from /databricks-datasets.", table_properties={ "quality": "bronze" } ) def clickstream_raw(): return ( spark.read.option("inferSchema", "true").json(json_path) ) """ SideStep(step, pipeline_id, g) df = clickstream_raw() df.display() step = """ @dlt.create_table( comment="Wikipedia clickstream dataset with cleaned-up datatypes / column names and quality expectations.", table_properties={ "quality": "silver" } ) @dlt.expect("valid_current_page", "current_page_id IS NOT NULL AND current_page_title IS NOT NULL") @dlt.expect_or_fail("valid_count", "click_count > 0") def clickstream_clean(): return ( dlt.read("clickstream_raw") .withColumn("current_page_id", expr("CAST(curr_id AS INT)")) .withColumn("click_count", expr("CAST(n AS INT)")) .withColumn("previous_page_id", expr("CAST(prev_id AS INT)")) .withColumnRenamed("curr_title", "current_page_title") .withColumnRenamed("prev_title", "previous_page_title") .select("current_page_id", "current_page_title", "click_count", "previous_page_id", "previous_page_title") ) """ SideStep(step, pipeline_id, g) df = clickstream_clean() df.display() ```

نحوه نصب

نصب پکیج whl dlt-sidestep-0.0.8:

pip install dlt-sidestep-0.0.8.whl

نصب پکیج tar.gz dlt-sidestep-0.0.8:

pip install dlt-sidestep-0.0.8.tar.gz