corr2cause

  • توضیحات :

Corr2cause

استنتاج علی یکی از ویژگی های بارز هوش انسان است.

Corr2cause یک مجموعه داده در مقیاس بزرگ از بیش از 400 هزار نمونه است که بر اساس آن هفده LLM موجود در مقاله مربوطه ارزیابی شده است.

به طور کلی، Corr2cause شامل 415944 نمونه است که 18.57٪ در نمونه های معتبر است. میانگین طول فرض 424.11 توکن و فرضیه 10.83 توکن است. داده ها به ترتیب به 411452 نمونه آموزشی، 2246 نمونه توسعه و آزمایش تقسیم می شوند. از آنجایی که هدف اصلی مجموعه داده، محک زدن عملکرد LLMها است، مجموعه‌های آزمایش و توسعه برای داشتن پوششی جامع بر تمام اندازه‌های نمودارها در اولویت قرار گرفته‌اند.

شکاف مثال ها
'dev' 2,246
'test' 2,246
'train' 411,452
  • ساختار ویژگی :
FeaturesDict({
    'input': Text(shape=(), dtype=string),
    'label': int64,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
ورودی متن رشته
برچسب تانسور int64
  • نقل قول :
@misc{jin2023large,
      title={Can Large Language Models Infer Causation from Correlation?},
      author={Zhijing Jin and Jiarui Liu and Zhiheng Lyu and Spencer Poff and Mrinmaya Sachan and Rada Mihalcea and Mona Diab and Bernhard Schölkopf},
      year={2023},
      eprint={2306.05836},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}