przepływ tensorowy:: ops:: PróbkaDistortedBoundingBox

#include <image_ops.h>

Wygeneruj pojedynczą, losowo zniekształconą ramkę ograniczającą obraz.

Streszczenie

Adnotacje dotyczące obwiedni są często dostarczane jako dodatek do etykiet podstawowych w zadaniach rozpoznawania obrazu lub lokalizacji obiektów. Powszechną techniką uczenia takiego systemu jest losowe zniekształcanie obrazu przy jednoczesnym zachowaniu jego zawartości, czyli powiększanie danych . Ta operacja generuje losowo zniekształconą lokalizację obiektu, tj. obwiednię, biorąc pod uwagę image_size , bounding_boxes i serię ograniczeń.

Wynikiem tej operacji jest pojedyncza ramka ograniczająca, której można użyć do przycięcia oryginalnego obrazu. Dane wyjściowe są zwracane jako 3 tensory: begin , size i bboxes . Pierwsze 2 tensory można wprowadzić bezpośrednio do tf.slice w celu przycięcia obrazu. Te ostatnie można dostarczyć do tf.image.draw_bounding_boxes w celu wizualizacji wyglądu ramki ograniczającej.

Ramki ograniczające są dostarczane i zwracane jako [y_min, x_min, y_max, x_max] . Współrzędne ramki ograniczającej są zmiennoprzecinkowe w [0.0, 1.0] w stosunku do szerokości i wysokości obrazu bazowego.

Na przykład,

    # Generate a single distorted bounding box.
    begin, size, bbox_for_draw = tf.image.sample_distorted_bounding_box(
        tf.shape(image),
        bounding_boxes=bounding_boxes)

    # Draw the bounding box in an image summary.
    image_with_box = tf.image.draw_bounding_boxes(tf.expand_dims(image, 0),
                                                  bbox_for_draw)
    tf.summary.image('images_with_box', image_with_box)

    # Employ the bounding box to distort the image.
    distorted_image = tf.slice(image, begin, size)

Należy pamiętać, że jeśli nie są dostępne żadne informacje o ramce ograniczającej, ustawienie use_image_if_no_bounding_boxes = true zakłada, że ​​istnieje jedna niejawna ramka ograniczająca obejmująca cały obraz. Jeśli use_image_if_no_bounding_boxes ma wartość false i nie podano żadnych ramek ograniczających, zgłaszany jest błąd.

Argumenty:

  • zakres: Obiekt Scope
  • image_size: 1-D, zawierający [height, width, channels] .
  • bounding_boxes: 3-D z kształtem [batch, N, 4] opisującym N ramek ograniczających skojarzonych z obrazem.

Opcjonalne atrybuty (patrz Attrs ):

  • ziarno: Jeśli seed lub seed2 są ustawione na wartość różną od zera, generator liczb losowych jest zaszczepiany danym seed . W przeciwnym razie jest on zaszczepiany losowo.
  • nasiono2: Drugie ziarno, aby uniknąć kolizji nasion.
  • min_object_covered: Przycięty obszar obrazu musi zawierać co najmniej tę część dowolnej dostarczonej ramki ograniczającej. Wartość tego parametru powinna być nieujemna. W przypadku wartości 0 przycięty obszar nie musi zachodzić na żadną z dostarczonych ramek ograniczających.
  • aspekt_ratio_range: Przycięty obszar obrazu musi mieć współczynnik kształtu = szerokość/wysokość mieszczący się w tym zakresie.
  • area_range: Przycięty obszar obrazu musi zawierać część dostarczonego obrazu w tym zakresie.
  • max_attempts: Liczba prób wygenerowania przyciętego obszaru obrazu z określonymi ograniczeniami. Po niepowodzeniach max_attempts zwróć cały obraz.
  • use_image_if_no_bounding_boxes: Kontroluje zachowanie, jeśli nie podano ramek ograniczających. Jeśli to prawda, załóż niejawną ramkę ograniczającą obejmującą całe wejście. Jeśli fałszywe, zgłoś błąd.

Zwroty:

  • Początek Output : 1-D, zawierający [offset_height, offset_width, 0] . Podaj jako dane wejściowe do tf.slice .
  • Rozmiar Output : 1-D, zawierający [target_height, target_width, -1] . Podaj jako dane wejściowe do tf.slice .
  • Output bboxy: 3-D z kształtem [1, 1, 4] zawierającym zniekształconą ramkę ograniczającą. Podaj jako dane wejściowe do tf.image.draw_bounding_boxes .

Konstruktory i destruktory

SampleDistortedBoundingBox (const :: tensorflow::Scope & scope, :: tensorflow::Input image_size, :: tensorflow::Input bounding_boxes)
SampleDistortedBoundingBox (const :: tensorflow::Scope & scope, :: tensorflow::Input image_size, :: tensorflow::Input bounding_boxes, const SampleDistortedBoundingBox::Attrs & attrs)

Atrybuty publiczne

bboxes
begin
operation
size

Publiczne funkcje statyczne

AreaRange (const gtl::ArraySlice< float > & x)
AspectRatioRange (const gtl::ArraySlice< float > & x)
MaxAttempts (int64 x)
MinObjectCovered (float x)
Seed (int64 x)
Seed2 (int64 x)
UseImageIfNoBoundingBoxes (bool x)

Struktury

tensorflow:: ops:: SampleDistortedBoundingBox:: Atrybuty

Opcjonalne moduły ustawiające atrybuty dla SampleDistortedBoundingBox .

Atrybuty publiczne

bboxy

::tensorflow::Output bboxes

zaczynać

::tensorflow::Output begin

działanie

Operation operation

rozmiar

::tensorflow::Output size

Funkcje publiczne

PróbkaDistortedBoundingBox

 SampleDistortedBoundingBox(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input image_size,
  ::tensorflow::Input bounding_boxes
)

PróbkaDistortedBoundingBox

 SampleDistortedBoundingBox(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input image_size,
  ::tensorflow::Input bounding_boxes,
  const SampleDistortedBoundingBox::Attrs & attrs
)

Publiczne funkcje statyczne

ObszarZakres

Attrs AreaRange(
  const gtl::ArraySlice< float > & x
)

Zakres proporcji

Attrs AspectRatioRange(
  const gtl::ArraySlice< float > & x
)

Maksymalna liczba prób

Attrs MaxAttempts(
  int64 x
)

Minimalny obiekt objęty

Attrs MinObjectCovered(
  float x
)

Nasienie

Attrs Seed(
  int64 x
)

Nasienie2

Attrs Seed2(
  int64 x
)

UżyjImageIfNoBoundingBoxes

Attrs UseImageIfNoBoundingBoxes(
  bool x
)