معیار

  • توضیحات :

مجموعه داده مدلسازی کریتیو ارتقاء

این مجموعه داده همراه با مقاله منتشر شده است: "معیار مقیاس بزرگ برای مدلسازی ارتقاء" Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab)، مسیح رضا امینی (LIG، Grenoble INP)

این اثر در: کارگاه آموزشی AdKDD 2018، همراه با KDD 2018 منتشر شده است.

توضیحات داده ها

این مجموعه داده با جمع‌آوری داده‌های حاصل از چندین آزمایش افزایشی ساخته می‌شود، یک روش آزمایشی تصادفی خاص که در آن بخشی تصادفی از جمعیت از هدف قرار گرفتن تبلیغات جلوگیری می‌شود. این شامل 25 میلیون ردیف است که هر یک نشان دهنده یک کاربر با 11 ویژگی، یک نشانگر درمان و 2 برچسب (بازدید و تبدیل) است.

زمینه های

در اینجا شرح مفصلی از فیلدها آمده است (آنها در فایل با کاما از هم جدا شده اند):

  • f0، f1، f2، f3، f4، f5، f6، f7، f8، f9، f10، f11: مقادیر ویژگی (متراکم، شناور)
  • درمان: گروه درمان (1 = درمان، 0 = کنترل)
  • تبدیل: آیا یک تبدیل برای این کاربر رخ داده است (باینری، برچسب)
  • بازدید: آیا بازدیدی برای این کاربر رخ داده است (باینری، برچسب)
  • قرار گرفتن در معرض: اثر درمان، اینکه آیا کاربر به طور موثر در معرض قرار گرفته است (دودویی)

ارقام کلیدی

  • فرمت: CSV
  • حجم: 459 مگابایت (فشرده شده)
  • ردیف: 25,309,483
  • میانگین نرخ بازدید: 0.04132
  • میانگین نرخ تبدیل: 0.00229
  • نسبت درمان: 0.846

وظایف

مجموعه داده با پیش بینی افزایش به عنوان وظیفه اصلی جمع آوری و تهیه شد. به‌علاوه، می‌توانیم کاربردهای مرتبطی مانند، اما نه محدود به موارد زیر را پیش‌بینی کنیم:

شکاف مثال ها
'train' 13,979,592
  • ساختار ویژگی :
FeaturesDict({
    'conversion': bool,
    'exposure': bool,
    'f0': float32,
    'f1': float32,
    'f10': float32,
    'f11': float32,
    'f2': float32,
    'f3': float32,
    'f4': float32,
    'f5': float32,
    'f6': float32,
    'f7': float32,
    'f8': float32,
    'f9': float32,
    'treatment': int64,
    'visit': bool,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تبدیل تانسور بوول
ارائه تانسور بوول
f0 تانسور float32
f1 تانسور float32
f10 تانسور float32
f11 تانسور float32
f2 تانسور float32
f3 تانسور float32
f4 تانسور float32
f5 تانسور float32
f6 تانسور float32
f7 تانسور float32
f8 تانسور float32
f9 تانسور float32
رفتار تانسور int64
بازدید کنید تانسور بوول
  • کلیدهای نظارت شده (مشاهده as_supervised doc ): ({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')

  • شکل ( tfds.show_examples ): پشتیبانی نمی شود.

  • مثال‌ها ( tfds.as_dataframe ):

  • نقل قول :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}