Dataset

مجموعة بيانات فئة مجردة عامة
الفئات الفرعية المباشرة المعروفة

يمثل قائمة كبيرة محتملة من العناصر المستقلة (العينات)، ويسمح بإجراء التكرار والتحويلات عبر هذه العناصر.

المقاولون العامون

مجموعة البيانات (Ops tf، متغير <?>، قائمة<Class<? تمتد TType >>outputTypes، List <Shape> outputShapes)

الأساليب العامة

مجموعة البيانات النهائية
دفعة (حجم الدفعة الطويلة، قطرة منطقيةLastBatch)
تجميع عناصر مجموعة البيانات هذه في دفعات.
مجموعة البيانات النهائية
دفعة (حجم دفعة طويلة)
تجميع عناصر مجموعة البيانات هذه في دفعات.
مجموعة البيانات الثابتة
fromTensorSlices (Ops tf، List< Operand <?>> الموترات، List<Class<? يمتد TType >>outputTypes)
ينشئ "مجموعة بيانات" في الذاكرة تكون عناصرها عبارة عن شرائح من الموترات المحددة.
العمليات
القائمة< الشكل >
الحصول على أشكال الإخراج ()
احصل على قائمة بالأشكال لكل مكون من مجموعة البيانات هذه.
قائمة <الفئة <؟ يمتد نوع TT >>
أنواع الإخراج ()
احصل على قائمة بأنواع المخرجات لكل مكون من مجموعة البيانات هذه.
المعامل <؟>
الحصول على متغير ()
احصل على الموتر المتغير الذي يمثل مجموعة البيانات هذه.
التكرار<قائمة< المعامل <?>>>
مكرر ()
ينشئ مكررًا يتكرر عبر جميع دفعات مجموعة البيانات هذه بطريقة حريصة.
DatasetIterator
makeInitializeableIterator ()
ينشئ "DatasetIterator" الذي يمكن استخدامه للتكرار على عناصر مجموعة البيانات هذه.
DatasetIterator
ميك وان شوت إيتيريتور ()
ينشئ "DatasetIterator" الذي يمكن استخدامه للتكرار على عناصر مجموعة البيانات هذه.
مجموعة البيانات
الخريطة (وظيفة <قائمة< المعامل <?>>، قائمة < المعامل <؟>>> مخطط الخرائط)
إرجاع مجموعة بيانات جديدة تقوم بتعيين دالة على جميع العناصر التي يتم إرجاعها بواسطة مجموعة البيانات هذه.
مجموعة البيانات
MapAllComponents (الوظيفة< المعامل <?>، المعامل <?>> مخطط الخرائط)
إرجاع مجموعة بيانات جديدة تقوم بتعيين دالة عبر جميع العناصر من مجموعة البيانات هذه، على جميع مكونات كل عنصر.
مجموعة البيانات
MapOneComponent (مؤشر int، الوظيفة< المعامل <?>، المعامل <?>> مخطط الخرائط)
إرجاع مجموعة بيانات جديدة تقوم بتعيين وظيفة عبر جميع العناصر من مجموعة البيانات هذه، على مكون واحد من كل عنصر.
مجموعة البيانات النهائية
تخطي (العد الطويل)
تُرجع "مجموعة بيانات" جديدة تتخطى "عدد" العناصر الأولية من مجموعة البيانات هذه
مجموعة البيانات النهائية
خذ (عد طويل)
تُرجع "مجموعة بيانات" جديدة تحتوي فقط على عناصر "العدد" الأولى من مجموعة البيانات هذه.
مجموعة البيانات الثابتة
textLineDataset (Ops tf، اسم ملف السلسلة، نوع ضغط السلسلة، حجم المخزن المؤقت الطويل)
مجموعة البيانات الثابتة
tfRecordDataset (Ops tf، اسم ملف السلسلة، نوع ضغط السلسلة، حجم المخزن المؤقت الطويل)
خيط

الطرق الموروثة

المقاولون العامون

مجموعة البيانات العامة (Ops tf، متغير <?>، قائمة <فئة <؟ تمتد TType >> أنواع الإخراج، قائمة < الشكل > أشكال الإخراج)

الأساليب العامة

مجموعة البيانات النهائية العامة (حجم الدُفعة الطويلة، قطرة منطقيةLastBatch)

تجميع عناصر مجموعة البيانات هذه في دفعات.

حدود
حجم الدُفعة عدد العناصر المطلوبة لكل دفعة
dropLastBatch ما إذا كان سيتم استبعاد الدفعة النهائية إذا كانت تحتوي على أقل من عناصر "حجم الدفعة".
المرتجعات
  • مجموعة بيانات مجمعة

مجموعة البيانات النهائية العامة (حجم الدُفعة الطويل)

تجميع عناصر مجموعة البيانات هذه في دفعات. تتضمن الدفعة الأخيرة، حتى لو كانت تحتوي على أقل من عناصر "حجم الدفعة".

حدود
حجم الدُفعة عدد العناصر المطلوبة لكل دفعة
المرتجعات
  • مجموعة بيانات مجمعة

مجموعة بيانات ثابتة عامة من TensorSlices (Ops tf، List< Operand <?>> Tensors، List<Class<؟ يمتد TType >>outputTypes)

ينشئ "مجموعة بيانات" في الذاكرة تكون عناصرها عبارة عن شرائح من الموترات المحددة. سيكون كل عنصر في مجموعة البيانات هذه عبارة عن List<Operand<?>> ، يمثل شرائح (على سبيل المثال، دفعات) من الموترات المتوفرة.

حدود
tf ملحق العمليات
الموترات قائمة Operand<?> التي تمثل مكونات مجموعة البيانات هذه (مثل الميزات والتسميات)
أنواع الإخراج قائمة فئات نوع الموتر التي تمثل نوع البيانات لكل مكون من مجموعة البيانات هذه.
المرتجعات
  • "مجموعة بيانات" جديدة

العمليات العامة getOpsInstance ()

القائمة العامة < الشكل > getOutputShapes ()

احصل على قائمة بالأشكال لكل مكون من مجموعة البيانات هذه.

القائمة العامة <الفئة <؟ يمتد TType >> getOutputTypes ()

احصل على قائمة بأنواع المخرجات لكل مكون من مجموعة البيانات هذه.

المعامل العام <?> getVariant ()

احصل على الموتر المتغير الذي يمثل مجموعة البيانات هذه.

مكرر عام<List< Operand <?>>> مكرر ()

ينشئ مكررًا يتكرر عبر جميع دفعات مجموعة البيانات هذه بطريقة حريصة. كل دفعة عبارة عن قائمة من المكونات، والتي يتم إرجاعها ككائنات "الإخراج".

تتيح هذه الطريقة التكرار لكل دفعة من خلال الدُفعات عند التشغيل في الوضع الحريص. للتعرف على التكرار الدفعي لوضع الرسم البياني، راجع `makeOneShotIterator`.

المرتجعات
  • مكرر من خلال دفعات من مجموعة البيانات هذه.

مجموعة البيانات العامة MakeInitializeableIterator ()

ينشئ "DatasetIterator" الذي يمكن استخدامه للتكرار على عناصر مجموعة البيانات هذه.

يجب تهيئة هذا المكرِّر باستدعاء `iterator.makeInitializer(Dataset)` قبل أن يتم استرجاع العناصر في حلقة.

المرتجعات
  • `DatasetIterator` جديد يعتمد على بنية مجموعة البيانات هذه.

DatasetIterator العامة makeOneShotIterator ()

ينشئ "DatasetIterator" الذي يمكن استخدامه للتكرار على عناصر مجموعة البيانات هذه. يضمن استخدام makeOneShotIterator تهيئة المكرّر تلقائيًا في مجموعة البيانات هذه. يتخطى في وضع الرسم البياني، ستتم إضافة عملية التهيئة إلى قائمة تهيئة الرسم البياني، والتي يجب تشغيلها عبر `tf.init()`:

السابق:

     try (Session session = new Session(graph) {
         // Immediately run initializers
         session.run(tf.init());
     }
 

في الوضع المتحمس، سيتم تشغيل المُهيئ تلقائيًا نتيجة لهذا الاستدعاء.

المرتجعات
  • `DatasetIterator` جديد يعتمد على بنية مجموعة البيانات هذه.

خريطة مجموعة البيانات العامة (وظيفة<قائمة< المعامل <?>>، قائمة< المعامل <?>>> مخطط الخرائط)

إرجاع مجموعة بيانات جديدة تقوم بتعيين دالة على جميع العناصر التي يتم إرجاعها بواسطة مجموعة البيانات هذه.

على سبيل المثال، لنفترض أن كل عنصر عبارة عن List<Operand<?>> تحتوي على مكونين: (الميزات، التسميات).

الاتصال

dataset.map(components -> {
      Operand<?> features = components.get(0);
      Operand<?> labels   = components.get(1);

      return Arrays.asList(
        tf.math.mul(features, tf.constant(2)),
        tf.math.mul(labels, tf.constant(5))
      );
 );
 }
سيتم تعيين الوظيفة على مكونات "الميزات" و"التسميات"، وضرب الميزات في 2، وضرب التسميات في 5.

حدود
مصمم الخرائط الوظيفة التي سيتم تطبيقها على كل عنصر من عناصر هذا المكرر.
المرتجعات
  • مجموعة بيانات جديدة تطبق "مخطط الخرائط" على كل عنصر من عناصر هذا المكرر.

مجموعة البيانات العامة MapAllComponents (الوظيفة< المعامل <?>، المعامل <?>> مخطط الخرائط)

إرجاع مجموعة بيانات جديدة تقوم بتعيين دالة عبر جميع العناصر من مجموعة البيانات هذه، على جميع مكونات كل عنصر.

على سبيل المثال، لنفترض أن كل عنصر عبارة عن List<Operand<?>> تحتوي على مكونين: (الميزات، التسميات).

سيؤدي استدعاء dataset.mapAllComponents(component -> tf.math.mul(component, tf.constant(2))) إلى تعيين الدالة على مكونات `الميزات` و`التسميات` لكل عنصر، وضربهم جميعًا في 2

حدود
مصمم الخرائط الوظيفة التي سيتم تطبيقها على كل مكون
المرتجعات
  • مجموعة بيانات جديدة تطبق "مخطط الخرائط" على جميع مكونات كل عنصر.

مجموعة البيانات العامة MapOneComponent (مؤشر int، الوظيفة< المعامل <?>، المعامل <?>> مخطط الخرائط)

إرجاع مجموعة بيانات جديدة تقوم بتعيين وظيفة عبر جميع العناصر من مجموعة البيانات هذه، على مكون واحد من كل عنصر.

على سبيل المثال، لنفترض أن كل عنصر عبارة عن List<Operand<?>> تحتوي على مكونين: (الميزات، التسميات).

سيؤدي استدعاء dataset.mapOneComponent(0, features -> tf.math.mul(features, tf.constant(2))) إلى تعيين الدالة على مكون `features` لكل عنصر، وضرب كل منها في 2.

حدود
فِهرِس مؤشر المكون للتحويل.
مصمم الخرائط الوظيفة التي سيتم تطبيقها على المكون المستهدف.
المرتجعات
  • مجموعة بيانات جديدة تطبق "مخطط الخرائط" على المكون في الفهرس المختار.

تخطي مجموعة البيانات النهائية العامة (عدد طويل)

تُرجع "مجموعة بيانات" جديدة تتخطى "عدد" العناصر الأولية من مجموعة البيانات هذه

حدود
عدد عدد العناصر المطلوب "تخطيها" لتكوين مجموعة البيانات الجديدة.
المرتجعات
  • مجموعة بيانات جديدة تمت إزالة عناصر `العدد` منها.

مجموعة البيانات النهائية العامة (عدد طويل)

تُرجع "مجموعة بيانات" جديدة تحتوي فقط على عناصر "العدد" الأولى من مجموعة البيانات هذه.

حدود
عدد عدد العناصر المطلوب "أخذها" من مجموعة البيانات هذه.
المرتجعات
  • مجموعة بيانات جديدة تحتوي على عناصر "العدد" الأولى من مجموعة البيانات هذه.

مجموعة البيانات الثابتة العامة textLineDataset (Ops tf، اسم ملف السلسلة، نوع ضغط السلسلة، حجم المخزن المؤقت الطويل)

مجموعة البيانات الثابتة العامة tfRecordDataset (Ops tf، اسم ملف السلسلة، نوع ضغط السلسلة، حجم المخزن المؤقت الطويل)

سلسلة عامة إلى سلسلة ()