akry: (16 tons)

Есть два основных формата ввода ключевых слов и фраз:

  1. Слова и фразы разделяются запятыми. Например, «кошка, радость голодания, кто написал мне в тапки». Lightroom, Liveinternet, Livejournal, Wordpress.
  2. Слова разделяются пробелами, если в фразе много слов, она заключается в кавычки. Например, «медведь грибник "лесные развлечения" "как быстро сбросить вес на природе"». Это flickr, diigo.

Скажите, я один ненавижу второй вариант? Имхо элементы в списке идеологически правильнее разделять запятыми. И у меня много ключевых фраз, состоящих больше чем из одного слова.

offtopic: радиоактивный оркестр из изотопов

Поделиться, оценить: Процитировать в LiveJournal! Процитировать в LiveInternet! Процитировать в Twitter! Добавить блог в GoogleReader!    
akry: (Default)

Лица Пикасы

Цель эксперимента: облегчить поиск людей на фотографиях. Не каких-то конкретных, а вообще фотографий, на которых есть люди. Очень удобно, когда ты можешь по-быстренькому выбрать из набора типажей.

Граничные условия: теги должны быть в фотографиях в Лайтруме. Ибо он — основная среда для работы, остальное — баловство.

Задумка: Picasa умеет искать на фотографиях лица. Следовательно если найти с её помощью все лица и пометить эти фотографии одним тегом (например «faces»), то цель будет достигнута.

Особенности реализации и камни на пути. На практике всё оказалось сложнее.

Во-первых, Пикаса слабо настраиваема. Это одна из программ в любимом стиле Apple: «Мы считаем, что стопроцентно позаботились о юзабилити, а если вам что не нравится, идите в жопу, яблокофоб». Т.е., идеи зашиты в практически ненастраиваемый интерфейс. Идеи иногда очень хорошие, а иногда глупые. Но исправить ты всё равно ничего не можешь, потому что создатели софта считают тебя несмышлёнышем, лучшая одёжка которому — смирительная рубашка. В нашем случае эта «рубашка» проявилась в невозможности задать минимальный размер лица. Ну не нужны мне лица высотой в пять пикселей, выхваченные из толпы. А уж как сложно понять — Пикаса уже обработала все фотографии, или ещё будет что-то доделывать? Надпись «найдено 500 лиц, осталось обработать ещё 3000» через полчаса меняется на «найдено 501 лицо, осталось обработать ещё 20,000, займёт 19 часов», а ещё через пять минут на «найдено 358 лиц, осталось обработать ещё 500».

Во-вторых, Пикаса — тормоз. Её просмотрщик мне нравится скоростью, а сама Пикаса как раз тормознутостью и не нравится. Обработка каталога из 20К фотографий заняла больше суток.

В-третьих, Пикаса не пишет теги в EXIF. Surprise! Пикаса пишет теги в собственный файл «.picasa.ini» в той же папке, где и фото. Эта проблема была решена с помощью написания скрипта, который парсил эти файлы, тащил из них ключевые слова и переносил их в картинки (и XMP) с помощью exiftool.

В-четвёртых, Лайтрум не может отличить изменённые картинки от остальных. Поэтому приходится считывать метаданные из всех, что тоже занимает время. Можно было бы попробовать сделать инъекции в его бд на sqlite3, но имхо это уже чересчур.

Результат. Помечено 1400+ картинок с лицами. Беглый взгляд на каталог показывает, что ещё как минимум столько же не найдено, причём совершенно очевидных годных лиц. Я бы спокойно отнёсся и к ложным срабатываниям, и к пятипиксельным физиономиям, если бы охват был стопроцентный. А так непонятно, ради чего система напрягалась, творила чудеса распознавания, если не сумела разглядеть портрет в анфас во весь кадр.

Выводы. Эксперимент признать неудачным. Трудозатраты велики, выход мал. Просто фигуры людей не отмечены, много нужно доделывать. С оговоркой — технология переноса тегов из Picasa в Lightroom отлажена, так что если потребуется отметить лица или перенести другие теги (не представляю пока, зачем), то это можно будет сделать легко.

 

Bonus. В XMP ключевые слова эксифтулом нужно писать не аргументом «-keywords», а «-XMP-dc:Subject+="слово"». А в JPG ещё и «-IPTC:keywords+="слово"».

akry: (Default)

Синонимы в Lightroom

Я тут полазил по фликеру и понял, что не все знают про такой удобный механизм — синонимы для ключевых слов.

Всё очень просто — вы не пишете все возможные ключевые слова для фотки, а задаёте одно (я предпочитаю английское), после чего добавляете к нему произвольное количество синонимов. Например, название на русском, на местном, альтернативные варианты названия, распространённые сокращения. При экспортре, если стоит галочка напротив «Export Synonyms», все они будут автоматически добавлены в картинку.

Плюсы очевидны: во время работы с фотками, вы не раздуваете список слов до неуправляемых размеров, в то же время все ваши фотографии помечены так, что их легко найти по всем вариантам ключевых слов. И изменять слова в случае ошибки намного легче.

Также полезный механизм для упорядочивания слов — иерархия. На картинке видно, что есть например группа «§styles», внутри которой ключевые слова «lomography» и «street» (каждое конечно же с синонимами). Экспорт самого слова «§styles» не разрешён, а вот «Export Containing Keywords» включён. Символ «§» я поставил только для того, чтобы отличать абстрактные группы от реальных ключевых слов, вы можете выбрать любую другую схему обозначений.

А вот слова «turquie» и «istanbul» будут экспортироваться в итоговую картинку, если она помечена словом «valens aqueduct». Таким образом, фотка, помеченная всего двумя тегами «IR» и «valents aqueduct» в экспортированном варианте уже содержит в себе обширный список: «bozdogan kemeri, bozdoğan kemeri, converted digital camera, false color, faux colour, Hoya R72, infrared photo, IR, istanbul, turquie, valens aqueduct, акведук баланса, акведук буздоган, акведук валенса, инфракрасная фотография, стамбул, турция». И вы на его составление сил уже не тратите.

Вот бы такой механизм реализовали ЖЖ и Ли.ру, как было бы хорошо…

 

++ Помимо поиска я использую неэкспортируемые ключевые слова, чтобы помнить, в каком состоянии фотография — увеличена ли резкость, отправлена ли эта фотография на flickr, panoramio, требуется ли добаботка в фотошопе и т. п.

April 2017

S M T W T F S
      1
2345678
9101112131415
16171819202122
23242526272829
30      

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 30th, 2025 05:46 am
Powered by Dreamwidth Studios