Структурирана информация
Пътувам си за към вкъщи, и съм пуснал една дълга като суджук мисъл относно как ще да е по-добре да организираме следващия CMS, защо понякога Outlook-a ми лази по нервите, и дали аджеба и аз съм бил същия келеш като тийнейджърите, с които се возя. Та да продължа - няколко бележки относно организирането на информацията и парчетата от нея.
- Дървовидна структура
- Досещате се може би - файловата система на win и по-голямата част от mail клиентите - папка в подпапка в подпапка. С файлове вътре. Oбекти, обвързани в взаимоотношение баща/дете. Дървото си е дърво, xml-а натурално представя информацията точно по този начин.
- Свойства на обектите
- Обектите притежават определен набор от свойства и съответна стойност или стойности за всяко едно от тях. Подобна абстракция иска да наложи Gmail, като предлага категоризиране на писмата, наместо местене по папки. Реализира се лесно релационна база данни. Честно казано бих използвал подобен тип организация на файловете/писмата си - Редактируеми от мен свойства, възможни стойности за тях, стойност(и) по подразбиране. Всеки обект/файл/писмо може да получи една или повече стойности съотнесени към всяко свойство. Само по себе си това не противоречи с дървовидната структура, дори напротив, допълва я, същевременно позволявайки голяма гъвкавост.
- Релация между обектите
- Възможност за дефиниране на различни типове връзки между отделните обекти - една малко странна концепция (справка - arrange by conversation в Outlook 2003). Би било интересно да бъде развита малко повече, тъй като определено е интересен начин за обогатяване и категоризиране на информацията.
Толкоз за сега. Не съм много способен да си подредя мислите, а и остави другото, не мога да измисля какво точно да потърся в Google като литература по темата. Помагайте
.
Ноември 19th, 2004 at 11:36 am
Бе аз да ти кажа, хората (особено нормалните хора) много трудно възприемат и работят с тия йерархични структури. За някой малки неща (1-2 клончета, десетина-двайсе листенца) са добри, но за файлова система на 200ГБ диск с 50 000 файла - не стават. Лично съм наблюдавал пък и колко има писано по въпроса - не е истина.
Примерно да си направиш лист с нещата за почивката или за Метро покупки (давам пример със себе си, защото аз много си падам по списъци) не ползвам дървета. Правя си линеен списък, като умишлено го подреждам по приоритет, защото познавам лейаута на щандовете на Метро.
То затова и тия туулчета като Google Desktop и на MacOSX новата търсачка са толкоз яки, защото ти махат грижата да мислиш „в коя папка го забих сия“ и обърквания от рода на /офис_проекти/работни/ и /лични_тъпни/работни/.
Ноември 19th, 2004 at 1:16 pm
Реално погледнато дървовидната структура е удобна при наличие на малко информация, но се дъни при опит да изразиш комплексни данни - давам пример - сортиране на снимки. Искаш да можеш да отличиш сички снимки с теб, всички от лятото, всички с чернобелия апарат… Само по себе си това не подлежи на категоризиране посредством папки, доста по лесно би било да се дефинират категории, възможни стойности за всяка, и категоризирането на всяка снимка.
Същият проблем може да бъде наблюдаван и в по-големите сайтове, които също размотават дървовидни структури - което ме кара да потърся алтернативни варианти за управление на съдържанието (с релационна база данни имаш доста голяма свобода).
Интересно би било да се види файлова система/Поща, която напълно да отхвърли идеята за папконареждането и да приложи друго категоризиране.
Ноември 19th, 2004 at 2:48 pm
Е то това е - метаданни. Нали iTunes, MediaPlayer и прочие така функционират. Осигури им читави метаданни (мп3 ид тагове) па им гледай сеира!
Затова и са измислени разните формати като EXIF, IPTC и прочие във фотографията. Да кажа от опит нещо - примерно ако си медийна агенция и получаваш от Ройтерс, ФрансПрес и ББС снимки, то само ги сваляш и ги бухаш в една папка. Пускаш си там който софт имаш и той изчита IPTC данните и ти прави една спретната организацийка по ключови думи, по автори, по дати, по каквото искаш/има.
И като заумнее малко AI-то на Google Desktop да може да улавя от въздуха за какво става дума в документ с име shitface.doc (примерно договор за наем) - в повечето случаи мета данните само ще си ги сбира/прави/търси.
Ноември 19th, 2004 at 10:32 pm
наскоро гугъл се сдобиха с една програма за организиране на снимки - Picasa(.com) - съответно програмата стана безплатна и аз се полакомих да я пробвам.
та, гугъл натам са се насочили - и в гощата им, и в сайта им, и пикасата организира снимките на компютъра по същия начин - бута .ини-та във всяка директория със снимки без да пипа нищо друго и като си я пуснеш програмката всичко се вижда организирано. it’s a kind’a magic
Ноември 19th, 2004 at 10:34 pm
oops, имах предвид, че ползва категории за всичко и дървовидната структура едва ли не вече е в кофата