Projekt opisu i analizy zdjęć prowadzony przez Google

Z pewnością żaden algorytm rozpoznawania twarzy nie ma kompletnie żadnych szans z człowiekiem, który wyłącznie spojrzy na fotografię. Z pewnością żadna maszyna nie dorównuje ludzkiemu mózgowi. Jednak każdy przyzna, że katalogowanie zdjęć może stać się utrapieniem, a opisy po paru chwilach stają się nie do końca, takie jakie byśmy chcieli. Możemy spotkać wiele takich softów, lecz wiele z nich jest często niedopracowanych, przez co nasze zmagania okazują się mało owocne. Jest nie lada zadaniem obsługi zbioru fotografii i dostarczeniu odpowiedniego opisu tematycznego, słownego. Mechanizm ten rozpocząłby swoją pracę już na początku podczas importu i katalogowania fotografii i przypisywać nie tylko proste ciągi słów kluczowych, ale adekwatne opisy przedstawianych zdjęć. Brzmi niesamowicie, ale już pierwsze testy specjalistów Google sugerują przełom. Zespół ten składa się z 4 naukowców, których odniesieniem do tego projektu był mechanizm auto tłumaczenia języków (RNN). W tym przypadku polega to na tłumaczeniu określonego modelu na świeżą treść. Wcześniej wspomniany moduł zastąpiono mechanizmem CNN, który postępuje podobnie, lecz opierając się o obraz. Ten wspólny element systemów reaguje na przekonwertowanie przetworzonego zdjęcia na opis.

Sami developerzy oceniają prace tego algorytmu jako poprawną. Przetestowano ten mechanizm na obrazach z pub. miejsc jak: Pascal, Flickr czy SB. Rezultaty przeanalizowano później ręcznie co dało wyniki bardzo różne. W niektórych przypadkach oceniono jako prawidłowe w innych jako nieprawidłowe, dlatego postanowiono nie przekazywać stosownych wyników.

Z pewnością mamy do czynienia z przełomem. Jest to mechanizm na tyle funkcjonalny i przydatny, że będzie potrafił wykonać za fotografa tą pracę, która dotychczas uznawana była za mało przyjemną i żmudną.

Screen Shot 2014 11 17 at 2.11.11 PM 1024x661 Projekt opisu i analizy zdjęć prowadzony przez Google

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.