Tài liệu tham khảo:
ro_sts_parallel
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:ro_sts_parallel/ro_sts_parallel')
- Sự miêu tả :
The RO-STS-Parallel (a Parallel Romanian English dataset - translation of the Semantic Textual Similarity) contains 17256 sentences in Romanian and English. It is a high-quality translation of the English STS benchmark dataset into Romanian.
- Giấy phép : Giấy phép CC BY-SA 4.0
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 2759 |
'train' | 11499 |
'validation' | 3001 |
- Đặc trưng :
{
"translation": {
"languages": [
"ro",
"en"
],
"id": null,
"_type": "Translation"
}
}
rosts-song song-en-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:ro_sts_parallel/rosts-parallel-en-ro')
- Sự miêu tả :
The RO-STS-Parallel (a Parallel Romanian English dataset - translation of the Semantic Textual Similarity) contains 17256 sentences in Romanian and English. It is a high-quality translation of the English STS benchmark dataset into Romanian.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 2759 |
'train' | 11499 |
'validation' | 3001 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"ro"
],
"id": null,
"_type": "Translation"
}
}