Tài liệu tham khảo:
enbg
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enbg')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1039885 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"bg"
],
"id": null,
"_type": "Translation"
}
}
encs
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/encs')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2981949 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"cs"
],
"id": null,
"_type": "Translation"
}
}
cuối cùng
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enda')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2414895 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"da"
],
"id": null,
"_type": "Translation"
}
}
kết thúc
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/ende')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 16264448 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"de"
],
"id": null,
"_type": "Translation"
}
}
enel
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enel')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1985233 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"el"
],
"id": null,
"_type": "Translation"
}
}
enes
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enes')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 21987267 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"es"
],
"id": null,
"_type": "Translation"
}
}
enet
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enet')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 853422 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"et"
],
"id": null,
"_type": "Translation"
}
}
enfi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enfi')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2156069 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"fi"
],
"id": null,
"_type": "Translation"
}
}
enfr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enfr')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 31374161 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"fr"
],
"id": null,
"_type": "Translation"
}
}
đính hôn
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enga')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 357399 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"ga"
],
"id": null,
"_type": "Translation"
}
}
nâng cao
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enhr')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1002053 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"hr"
],
"id": null,
"_type": "Translation"
}
}
enhu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enhu')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1901342 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"hu"
],
"id": null,
"_type": "Translation"
}
}
bắt đầu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enit')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 12162239 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"it"
],
"id": null,
"_type": "Translation"
}
}
làm theo
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enlt')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 844643 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"lt"
],
"id": null,
"_type": "Translation"
}
}
enlv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enlv')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 553060 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"lv"
],
"id": null,
"_type": "Translation"
}
}
cam kết
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enmt')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 195502 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"mt"
],
"id": null,
"_type": "Translation"
}
}
ennl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/ennl')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 5659268 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"nl"
],
"id": null,
"_type": "Translation"
}
}
bao gồm
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enpl')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3503276 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"pl"
],
"id": null,
"_type": "Translation"
}
}
cam kết
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enpt')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 8141940 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"pt"
],
"id": null,
"_type": "Translation"
}
}
enro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/enro')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1952043 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"ro"
],
"id": null,
"_type": "Translation"
}
}
ensk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/ensk')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1591831 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"sk"
],
"id": null,
"_type": "Translation"
}
}
ừm
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/ensl')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 660161 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"sl"
],
"id": null,
"_type": "Translation"
}
}
env
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:para_crawl/ensv')
- Sự miêu tả :
Web-Scale Parallel Corpora for Official European Languages.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3476729 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"sv"
],
"id": null,
"_type": "Translation"
}
}