- توضیحات :
Corr2cause
استنتاج علی یکی از ویژگی های بارز هوش انسان است.
Corr2cause یک مجموعه داده در مقیاس بزرگ از بیش از 400 هزار نمونه است که بر اساس آن هفده LLM موجود در مقاله مربوطه ارزیابی شده است.
به طور کلی، Corr2cause شامل 415944 نمونه است که 18.57٪ در نمونه های معتبر است. میانگین طول فرض 424.11 توکن و فرضیه 10.83 توکن است. داده ها به ترتیب به 411452 نمونه آموزشی، 2246 نمونه توسعه و آزمایش تقسیم می شوند. از آنجایی که هدف اصلی مجموعه داده، محک زدن عملکرد LLMها است، مجموعههای آزمایش و توسعه برای داشتن پوششی جامع بر تمام اندازههای نمودارها در اولویت قرار گرفتهاند.
صفحه اصلی : https://github.com/causalNLP/corr2cause/tree/main
کد منبع :
tfds.datasets.corr2cause.Builder
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
727.22 MiB
حجم مجموعه داده :
739.91 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'dev' | 2,246 |
'test' | 2,246 |
'train' | 411,452 |
- ساختار ویژگی :
FeaturesDict({
'input': Text(shape=(), dtype=string),
'label': int64,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
ورودی | متن | رشته | ||
برچسب | تانسور | int64 |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{jin2023large,
title={Can Large Language Models Infer Causation from Correlation?},
author={Zhijing Jin and Jiarui Liu and Zhiheng Lyu and Spencer Poff and Mrinmaya Sachan and Rada Mihalcea and Mona Diab and Bernhard Schölkopf},
year={2023},
eprint={2306.05836},
archivePrefix={arXiv},
primaryClass={cs.CL}
}