akry: (16 tons)

Под тегами здесь и далее подразумевается небольшой набор слов и коротких фраз, помогающий дополнительно описать содержимое — статьи, видео, фотографии, карточки в досье…  «Теги» в других источниках так же называются «ключевыми словами», «ключевыми фразыми», «хештегами».

Главные цели тегов такие:

  • категоризация и классификация
    • помощь в поиске
    • структурирование
  • метарамка
    • выражение отношения
    • привязка действий
    • фрейм
    • юмор, рефрейминг

Получатель у любой из цели может быть внутренний и внешний. Т.е., человек может писать теги и для других, и сам для себя.

Категоризация подразумевает объединение тем на основе каких-то общих признаков, то есть нужно явно или неявно выделить признаки, и по каким-то критерием счесть часть из них значимыми. Очевидно, что эти критерии будут связаны с тем, что планируется делать с категоризируемой информацией, и кто её адресат. С учётом этих вещей, хорошая категоризация помогает в поиске информации.

Классификация рецептов для целевой аудитории, заботящейся о своём весе, возможна по калорийности. Для тех, кто просто готовит, можно классифицировать блюда по ингредиентам. Для многих мужчин полезной будет классификация по возможным рискам для кухни и здоровья. Это облегчит поиск нужного рецепта.

Теги сами могут быть объединены в некие структуры. В простом виде, в иерархические. Тогда указание тегов ещё лучше помещает статью в некое семантическое поле.

Хороший пример: биологическая систематика. Плохой пример: эта классификаця животных.

Помимо этого, категоризация обладает и продуктивным свойством: подобно периодической системе элементов, категоризация позволяет оценить, насколько темы хорошо раскрыты.

Статьи о путешествиях можно маркировать, например, по доступности места, по бюджету, по экзотичности, по наличию туалетов и количеству дополнительных услуг в них. Тогда полезно будет проследить, чтобы указанные в тегах темы действительно раскрывались.

Следующая группа определяет уже не саму информацию, а способы её обработки. Теги могут указывать, как автор относится / предлагает относиться к информации; обозначать, какие предполагает действия с этой информацией; помещать информацию в соответствующий контекст, который так же может быть и юмористическим.

  • Примеры выражения отношения достаточно очевидны. Всякие «ужас», «позитив», «ужасно позитивно», «весело и страшно».
  • «Хозяину на заметку» подразумевает какие-то полезные практические советы по дому или рабовладению. «Лытдыбр» в большинстве случаев значит: «Не требуйте от моего текста многого, мне просто захотелось почесаться вслух, а тут как раз вы мимо проходите». А тег «занимательная химия» просит: «Сперва застрахуйте квартиру от взрыва и пожара, и напишите завещание».
  • Контекст неявно задаёт и отношение, и действия. Заметка «Десять национальных рецептов блюд из мяса» под тегом «вкусная и здоровая пища» будет восприниматься совсем иначе чем с пометкой «каникулы Джеймса Кука на Гавайях». Последнее может служить примером и юмористического рефрейминга.
  • Наличие множества контекстов, может задаваться и самим фактом указания одного из них. В статье об оптимизации налогов пометка «законные способы» вызывает желание заглянуть в полный список тегов. Разумеется, сугубо в образовательных целях. Аналогично с тегами «игра руками», «нетравматичные способы извлечения звуков», «при наличии инструмента» в посте про основы игры на фортепьяно. В этом плане расширение контекстного поля выступает также в описанной выше продуктивной роли, позволяя задуматься над содержимым всех возможных вариантов.

Разумеется, эта классификация тегов, как и любая другая, не описывает чётко отделимые друг от друга случаи, а скорее признаки, которые могут наличествовать у каждого из тегов или у их совокупности. Теги «опасно, Бирюлёво» рассказывают и об отношении, и о географической привязке заметки, при этом намекают на желаемые действия (для каждого — свои). И обретают иной смысл, если их же применить к статье о саммите АТЭС или к описанию ремонта своей кухни.

Применение тегов в маркетинговых целях здесь не рассматривается, поскольку это просто один из способов брендинга, в числе прочего реализующий часть из описанных здесь целей.

Следует добавить, что выбор слов для тега, сочетание тегов, предпочтение того или иного языка, даже сам факт наличия тегов также в какой-то мере формирует и отношение, и контекст.


Процитировать в LiveJournal! Процитировать в LiveInternet! Процитировать в Twitter! Добавить блог в GoogleReader!    

содержаниевся фототематикатолько фотографиимыслиновостиобзорыинтересноеalex-krylov.ru

информация • ключевые слова • ключевые фразы • теги


akry: (16 tons)

При действительно хорошей системе поиска и организации данных теги не нужны. Почти не нужны — только в качестве дополнительной информации, невыводимой никак из содержимого объекта. Например, к фото человека дописать его имя. Или описание переживаний фотографа — если имя ещё можно по лицу в БД пробить, то переживания уже вряд ли. Функция таких тегов — не описать существующий объект, а расширить его описание в новую область, увеличить количество информации. Как хорошая подпись к репортажной фотографии, они дают новую сущность.

Остальные же, описательные теги («собака», «красный», «зима», «снято на Кипре») — костыли, паллиатив. Большая часть моих (и не только моих) тегов для фоток относится как раз к этой категории. Будут лучше и доступнее системы распознавания объектов на картинках, большая часть таких штук будет делаться автоматически. Уже сейчас можно воспользоваться Picasa, чтобы автоматически найти лица вообще и конкретные персоналии в частности, и отметить их. Универсальные систмы распознавания любых объектов пока в разработке, но время летит быстро.

Собственно, Джеф Раскин в «Интерфейсе» ещё много лет назад продвигал схожую идею, высказывая наверное крамольную по тем временам мысль, что и файлы с их дурацкими именами не нужны, это рудимент почти полувековой давности. 


Процитировать в LiveJournal! Процитировать в LiveInternet! Процитировать в Twitter! Добавить блог в GoogleReader!    

содержаниевся фототематикатолько фотографиимыслиновостиобзорыинтересноеalex-krylov.ru

objects storage • ключевые слова • поиск • теги


akry: (16 tons)

Есть два основных формата ввода ключевых слов и фраз:

  1. Слова и фразы разделяются запятыми. Например, «кошка, радость голодания, кто написал мне в тапки». Lightroom, Liveinternet, Livejournal, Wordpress.
  2. Слова разделяются пробелами, если в фразе много слов, она заключается в кавычки. Например, «медведь грибник "лесные развлечения" "как быстро сбросить вес на природе"». Это flickr, diigo.

Скажите, я один ненавижу второй вариант? Имхо элементы в списке идеологически правильнее разделять запятыми. И у меня много ключевых фраз, состоящих больше чем из одного слова.

offtopic: радиоактивный оркестр из изотопов

Поделиться, оценить: Процитировать в LiveJournal! Процитировать в LiveInternet! Процитировать в Twitter! Добавить блог в GoogleReader!    
akry: (Default)

Лица Пикасы

Цель эксперимента: облегчить поиск людей на фотографиях. Не каких-то конкретных, а вообще фотографий, на которых есть люди. Очень удобно, когда ты можешь по-быстренькому выбрать из набора типажей.

Граничные условия: теги должны быть в фотографиях в Лайтруме. Ибо он — основная среда для работы, остальное — баловство.

Задумка: Picasa умеет искать на фотографиях лица. Следовательно если найти с её помощью все лица и пометить эти фотографии одним тегом (например «faces»), то цель будет достигнута.

Особенности реализации и камни на пути. На практике всё оказалось сложнее.

Во-первых, Пикаса слабо настраиваема. Это одна из программ в любимом стиле Apple: «Мы считаем, что стопроцентно позаботились о юзабилити, а если вам что не нравится, идите в жопу, яблокофоб». Т.е., идеи зашиты в практически ненастраиваемый интерфейс. Идеи иногда очень хорошие, а иногда глупые. Но исправить ты всё равно ничего не можешь, потому что создатели софта считают тебя несмышлёнышем, лучшая одёжка которому — смирительная рубашка. В нашем случае эта «рубашка» проявилась в невозможности задать минимальный размер лица. Ну не нужны мне лица высотой в пять пикселей, выхваченные из толпы. А уж как сложно понять — Пикаса уже обработала все фотографии, или ещё будет что-то доделывать? Надпись «найдено 500 лиц, осталось обработать ещё 3000» через полчаса меняется на «найдено 501 лицо, осталось обработать ещё 20,000, займёт 19 часов», а ещё через пять минут на «найдено 358 лиц, осталось обработать ещё 500».

Во-вторых, Пикаса — тормоз. Её просмотрщик мне нравится скоростью, а сама Пикаса как раз тормознутостью и не нравится. Обработка каталога из 20К фотографий заняла больше суток.

В-третьих, Пикаса не пишет теги в EXIF. Surprise! Пикаса пишет теги в собственный файл «.picasa.ini» в той же папке, где и фото. Эта проблема была решена с помощью написания скрипта, который парсил эти файлы, тащил из них ключевые слова и переносил их в картинки (и XMP) с помощью exiftool.

В-четвёртых, Лайтрум не может отличить изменённые картинки от остальных. Поэтому приходится считывать метаданные из всех, что тоже занимает время. Можно было бы попробовать сделать инъекции в его бд на sqlite3, но имхо это уже чересчур.

Результат. Помечено 1400+ картинок с лицами. Беглый взгляд на каталог показывает, что ещё как минимум столько же не найдено, причём совершенно очевидных годных лиц. Я бы спокойно отнёсся и к ложным срабатываниям, и к пятипиксельным физиономиям, если бы охват был стопроцентный. А так непонятно, ради чего система напрягалась, творила чудеса распознавания, если не сумела разглядеть портрет в анфас во весь кадр.

Выводы. Эксперимент признать неудачным. Трудозатраты велики, выход мал. Просто фигуры людей не отмечены, много нужно доделывать. С оговоркой — технология переноса тегов из Picasa в Lightroom отлажена, так что если потребуется отметить лица или перенести другие теги (не представляю пока, зачем), то это можно будет сделать легко.

 

Bonus. В XMP ключевые слова эксифтулом нужно писать не аргументом «-keywords», а «-XMP-dc:Subject+="слово"». А в JPG ещё и «-IPTC:keywords+="слово"».

akry: (Default)

Синонимы в Lightroom

Я тут полазил по фликеру и понял, что не все знают про такой удобный механизм — синонимы для ключевых слов.

Всё очень просто — вы не пишете все возможные ключевые слова для фотки, а задаёте одно (я предпочитаю английское), после чего добавляете к нему произвольное количество синонимов. Например, название на русском, на местном, альтернативные варианты названия, распространённые сокращения. При экспортре, если стоит галочка напротив «Export Synonyms», все они будут автоматически добавлены в картинку.

Плюсы очевидны: во время работы с фотками, вы не раздуваете список слов до неуправляемых размеров, в то же время все ваши фотографии помечены так, что их легко найти по всем вариантам ключевых слов. И изменять слова в случае ошибки намного легче.

Также полезный механизм для упорядочивания слов — иерархия. На картинке видно, что есть например группа «§styles», внутри которой ключевые слова «lomography» и «street» (каждое конечно же с синонимами). Экспорт самого слова «§styles» не разрешён, а вот «Export Containing Keywords» включён. Символ «§» я поставил только для того, чтобы отличать абстрактные группы от реальных ключевых слов, вы можете выбрать любую другую схему обозначений.

А вот слова «turquie» и «istanbul» будут экспортироваться в итоговую картинку, если она помечена словом «valens aqueduct». Таким образом, фотка, помеченная всего двумя тегами «IR» и «valents aqueduct» в экспортированном варианте уже содержит в себе обширный список: «bozdogan kemeri, bozdoğan kemeri, converted digital camera, false color, faux colour, Hoya R72, infrared photo, IR, istanbul, turquie, valens aqueduct, акведук баланса, акведук буздоган, акведук валенса, инфракрасная фотография, стамбул, турция». И вы на его составление сил уже не тратите.

Вот бы такой механизм реализовали ЖЖ и Ли.ру, как было бы хорошо…

 

++ Помимо поиска я использую неэкспортируемые ключевые слова, чтобы помнить, в каком состоянии фотография — увеличена ли резкость, отправлена ли эта фотография на flickr, panoramio, требуется ли добаботка в фотошопе и т. п.

April 2017

S M T W T F S
      1
2345678
9101112131415
16171819202122
23242526272829
30      

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 3rd, 2025 07:57 pm
Powered by Dreamwidth Studios