TensorFlow Hub Colab w zakresie wykrywania obiektów

Witamy w kolaboracji poświęconej wykrywaniu obiektów TensorFlow Hub! Ten notatnik przeprowadzi Cię przez kolejne etapy uruchamiania „niestandardowego” modelu wykrywania obiektów na obrazach.

Więcej modeli

Ta kolekcja zawiera modele TF2 wykrywania obiektów, które zostały przeszkolone na COCO 2017 zbiorze. Tutaj można znaleźć wszystkie modele wykrywania obiektów, które są obecnie przechowywane na tfhub.dev .

Import i konfiguracja

Zacznijmy od importu bazowego.

# This Colab requires TF 2.5.
pip install -U "tensorflow>=2.5"
import os
import pathlib

import matplotlib
import matplotlib.pyplot as plt

import io
import scipy.misc
import numpy as np
from six import BytesIO
from PIL import Image, ImageDraw, ImageFont
from six.moves.urllib.request import urlopen

import tensorflow as tf
import tensorflow_hub as hub



Uruchom następującą komórkę, aby utworzyć kilka narzędzi, które będą potrzebne później:

  • Metoda pomocnicza do załadowania obrazu
  • Mapa nazwy modelu do uchwytu TF Hub
  • Lista krotek z ludzkimi punktami kluczowymi dla zbioru danych COCO 2017. Jest to potrzebne w przypadku modeli z punktami kluczowymi.

Narzędzia do wizualizacji

Aby zwizualizować obrazy z odpowiednimi wykrytymi polami, punktami kluczowymi i segmentacją, użyjemy API TensorFlow Object Detection. Aby go zainstalować, sklonujemy repozytorium.

# Clone the tensorflow models repository
git clone --depth 1 https://github.com/tensorflow/models
Cloning into 'models'...
remote: Enumerating objects: 3069, done.[K
remote: Counting objects: 100% (3069/3069), done.[K
remote: Compressing objects: 100% (2600/2600), done.[K
remote: Total 3069 (delta 762), reused 1338 (delta 427), pack-reused 0[K
Receiving objects: 100% (3069/3069), 33.30 MiB | 18.65 MiB/s, done.
Resolving deltas: 100% (762/762), done.

Instalacja API Object Detection

sudo apt install -y protobuf-compiler
cd models/research/
protoc object_detection/protos/*.proto --python_out=.
cp object_detection/packages/tf2/setup.py .
python -m pip install .
WARNING: apt does not have a stable CLI interface. Use with caution in scripts.

dpkg-preconfigure: unable to re-open stdin: No such file or directory

Teraz możemy zaimportować zależności, których będziemy potrzebować później

from object_detection.utils import label_map_util
from object_detection.utils import visualization_utils as viz_utils
from object_detection.utils import ops as utils_ops

%matplotlib inline

Załaduj dane mapy etykiety (do drukowania).

Mapy oznakowania odpowiadają numery indeksów do nazw kategorii, tak, że gdy nasza sieć splot prognozuje 5 , wiemy, że odpowiada to airplane . Tutaj używamy wewnętrznych funkcji użytkowych, ale wszystko, co zwraca słownik mapujący liczby całkowite na odpowiednie etykiety łańcuchowe, będzie w porządku.

Dla uproszczenia zamierzamy załadować z repozytorium, do którego załadowaliśmy kod API Object Detection

PATH_TO_LABELS = './models/research/object_detection/data/mscoco_label_map.pbtxt'
category_index = label_map_util.create_category_index_from_labelmap(PATH_TO_LABELS, use_display_name=True)

Zbuduj model wykrywania i załaduj wstępnie wytrenowane wagi modeli

Tutaj wybierzemy, którego modelu Object Detection będziemy używać. Wybierz architekturę, a zostanie ona załadowana automatycznie. Jeśli chcesz zmienić model, aby później wypróbować inne architektury, po prostu zmień następną komórkę i wykonaj kolejne.

Wskazówka: Jeśli chcesz dowiedzieć się więcej szczegółów na temat wybranego modelu, można skorzystać z linku (model handle) i odczytać dodatkową dokumentację na TF Hub. Po wybraniu modelu dla ułatwienia wydrukujemy uchwyt.

Wybór modelu

Selected model:CenterNet HourGlass104 Keypoints 512x512
Model Handle at TensorFlow Hub: https://tfhub.dev/tensorflow/centernet/hourglass_512x512_kpts/1

Ładowanie wybranego modelu z TensorFlow Hub

Tutaj potrzebujemy tylko wybranego uchwytu modelu i użyjemy biblioteki Tensorflow Hub, aby załadować go do pamięci.

print('loading model...')
hub_model = hub.load(model_handle)
print('model loaded!')
loading model...
model loaded!

Ładowanie obrazu

Wypróbujmy model na prostym obrazie. Aby w tym pomóc, udostępniamy listę obrazów testowych.

Oto kilka prostych rzeczy do wypróbowania, jeśli jesteś ciekawy:

  • Spróbuj przeprowadzić wnioskowanie na własnych obrazach, po prostu prześlij je do colab i załaduj w taki sam sposób, jak w komórce poniżej.
  • Zmodyfikuj niektóre obrazy wejściowe i sprawdź, czy wykrywanie nadal działa. Kilka prostych rzeczy do wypróbowania to odwracanie obrazu w poziomie lub konwersja do skali szarości (pamiętaj, że nadal oczekujemy, że obraz wejściowy będzie miał 3 kanały).

Bądź ostrożny: przy użyciu obrazów z kanałem alfa, model oczekiwać obrazów oraz 3 kanały alfa będzie liczona jako 4.

Wybór obrazu (nie zapomnij wykonać komórki!)


Wyciąganie wniosków

Aby przeprowadzić wnioskowanie, wystarczy wywołać nasz załadowany model TF Hub.

Rzeczy, których możesz spróbować:

  • Wydrukować result['detection_boxes'] i spróbować dopasować lokalizacje polu po polach w obrazie. Zauważ, że współrzędne są podane w postaci znormalizowanej (tj. w przedziale [0, 1]).
  • sprawdź inne klucze wyjściowe obecne w wyniku. Pełną dokumentację można zobaczyć na stronie dokumentacji modeli (wskazując przeglądarkę na wydrukowany wcześniej uchwyt modelu)
# running inference
results = hub_model(image_np)

# different object detection models have additional results
# all of them are explained in the documentation
result = {key:value.numpy() for key,value in results.items()}
2021-11-05 12:34:59.833050: W tensorflow/core/grappler/optimizers/loop_optimizer.cc:907] Skipping loop optimization for Merge node with control input: StatefulPartitionedCall/cond/then/_918/cond/Assert/AssertGuard/branch_executed/_1114
dict_keys(['detection_classes', 'detection_keypoints', 'detection_keypoint_scores', 'detection_scores', 'detection_boxes', 'num_detections'])

Wizualizacja wyników

W tym miejscu będziemy potrzebować interfejsu API TensorFlow Object Detection, aby pokazać kwadraty z kroku wnioskowania (i punkty kluczowe, jeśli są dostępne).

pełna dokumentacja tej metody można zobaczyć tutaj

Tutaj można, na przykład, zestaw min_score_thresh do innych wartości (między 0 i 1), aby umożliwić większej liczbie wykrycia lub odfiltrować więcej wykryć.

label_id_offset = 0
image_np_with_detections = image_np.copy()

# Use keypoints if available in detections
keypoints, keypoint_scores = None, None
if 'detection_keypoints' in result:
  keypoints = result['detection_keypoints'][0]
  keypoint_scores = result['detection_keypoint_scores'][0]

      (result['detection_classes'][0] + label_id_offset).astype(int),




Wśród dostępnych modeli wykrywania obiektów znajduje się Maska R-CNN, a dane wyjściowe tego modelu umożliwiają segmentację instancji.

Wizualizować go będziemy używać tej samej metody zrobiliśmy wcześniej, ale dodanie aditional parametr: instance_masks=output_dict.get('detection_masks_reframed', None)

# Handle models with masks:
image_np_with_mask = image_np.copy()

if 'detection_masks' in result:
  # we need to convert np.arrays to tensors
  detection_masks = tf.convert_to_tensor(result['detection_masks'][0])
  detection_boxes = tf.convert_to_tensor(result['detection_boxes'][0])

  # Reframe the bbox mask to the image size.
  detection_masks_reframed = utils_ops.reframe_box_masks_to_image_masks(
            detection_masks, detection_boxes,
              image_np.shape[1], image_np.shape[2])
  detection_masks_reframed = tf.cast(detection_masks_reframed > 0.5,
  result['detection_masks_reframed'] = detection_masks_reframed.numpy()

      (result['detection_classes'][0] + label_id_offset).astype(int),
      instance_masks=result.get('detection_masks_reframed', None),

