Cảnh báo: API này không được dùng nữa và sẽ bị xóa trong phiên bản tương lai của TensorFlow sau khi thay thế ổn định.
StringNGrams
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Tạo ngram từ dữ liệu chuỗi rời rạc.
Op này chấp nhận một tensor rách rưới có 1 chiều rách rưới chỉ chứa các chuỗi và xuất ra một tensor rách rưới có 1 chiều rách rưới chứa ngram của chuỗi đó, nối dọc theo trục trong cùng.
Phương pháp công khai
tĩnh <T mở rộng Số> ChuỗiNGram <T> | tạo ( Phạm vi phạm vi, Dữ liệu toán hạng <String>, Toán hạng <T> dataSplits, Dấu tách chuỗi, Danh sách <Long> ngramWidths, Chuỗi leftPad, Chuỗi rightPad, PadWidth dài, Boolean bảo tồnShortSequences) Phương thức xuất xưởng để tạo một lớp bao bọc một hoạt động StringNGrams mới. |
Đầu ra <Chuỗi> | ngram () Các giá trị tensor của ngrams ragged tensor. |
Đầu ra <T> | ngramSplits () Tenxơ phân tách của tenxơ ngram đầu ra bị rách. |
Phương pháp kế thừa
Từ lớp java.lang.Object boolean | bằng (Đối tượng arg0) |
Lớp cuối cùng<?> | getClass () |
int | Mã Băm () |
khoảng trống cuối cùng | thông báo () |
khoảng trống cuối cùng | thông báoTất cả () |
Sợi dây | toString () |
khoảng trống cuối cùng | chờ đã (arg0 dài, int arg1) |
khoảng trống cuối cùng | chờ đã (arg0 dài) |
khoảng trống cuối cùng | Chờ đợi () |
Phương pháp công khai
public static StringNGrams <T> tạo ( Phạm vi phạm vi , Dữ liệu toán hạng <String>, Toán hạng <T> dataSplits, Dấu phân tách chuỗi, Danh sách <Long> ngramWidths, Chuỗi leftPad, Chuỗi rightPad, PadWidth dài, Boolean bảo tồnShortSequences)
Phương thức xuất xưởng để tạo một lớp bao bọc một hoạt động StringNGrams mới.
Thông số
phạm vi | phạm vi hiện tại |
---|
dữ liệu | Các giá trị tensor của tensor chuỗi rời rạc để tạo ra ngram. Phải là một tensor chuỗi 1D. |
---|
chia tách dữ liệu | Các tensor phân tách của tensor chuỗi rách rưới để tạo ra ngram. |
---|
dải phân cách | Chuỗi để nối giữa các phần tử của mã thông báo. Sử dụng "" để không có dấu phân cách. |
---|
ngramWidth | Kích thước của ngram cần tạo. |
---|
leftpad | Chuỗi được sử dụng để đệm phía bên trái của chuỗi ngram. Chỉ được sử dụng nếu pad_width != 0. |
---|
bàn phím phải | Chuỗi được sử dụng để đệm phía bên phải của chuỗi ngram. Chỉ được sử dụng nếu pad_width != 0. |
---|
chiều rộng đệm | Số phần tử đệm cần thêm vào mỗi bên của mỗi chuỗi. Lưu ý rằng phần đệm sẽ không bao giờ lớn hơn 'ngram_widths'-1 bất kể giá trị này. Nếu `pad_width=-1`, thì hãy thêm phần tử `max(ngram_widths)-1`. |
---|
Trả lại
- một phiên bản mới của StringNGrams
Đầu ra công khai <String> ngrams ()
Các giá trị tensor của ngrams ragged tensor.
Đầu ra công khai <T> ngramsSplits ()
Tenxơ phân tách của tenxơ ngram đầu ra bị rách.
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
Cập nhật lần gần đây nhất: 2023-12-01 UTC.
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"Thiếu thông tin tôi cần"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"Quá phức tạp/quá nhiều bước"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"Đã lỗi thời"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"Vấn đề về bản dịch"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"Vấn đề về mẫu/mã"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"Khác"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"Dễ hiểu"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"Giúp tôi giải quyết được vấn đề"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"Khác"
}]
{
"lastModified": "Cập nhật lần gần đây nhất: 2023-12-01 UTC.",
"confidential": False
}