مقدمه

عصر دیجیتال موجبات پیدایش همه نوع محصول دیجیتال­زاد را فراهم آورده است، در این میان منابع دیداری شنیداری بطور دائم در حال افزایش اند. ویدئوها، سوابق نواری و عکس ها تقریبا برای همه ما آشناست. امروزه ویدئوها معمولا ترکیبی از متن، صدا و فیلم هستند: ایستگاههای تلویزیونی، شرکت های انتشاراتی و دیگر سازمان ها هر ساله حجم عظیمی از ویدئوها را تولید می کنند. نمایش و سازماندهی کارآمد این منابع پیچیده برای مدیران و کاربران آن یک ضرورت است. یکی از پیش شرط های اصلی برای مدیریت  منابع دیداری شنیداری توسعه یک مجموعه فراداده ای مناسب برای این حوزه است، حوزه ای که در آن کاربران دارای سطوح مختلفی از نیازها هستند.

پروژه ای تحت عنوان مطالعه ابتکاری درباره فراداده دیداری شنیدرای و بازیابی آن به توسط بنیاد ملی علوم اجتماعی چین در دپارتمان مدیریت اطلاعات دانشگاه پکینگ از سال 2002 به این طرف آغاز شده است که هنوز هم در حال پیشرفت است. این مقاله حول این پروژه قرار دارد و به خاص به فراداده ویدئو متمرکز است.

 

2- طراحی مطالعه

از زمانی که توسعه یک مجموعه فراداده ای برای منابع دیداری شنیداری در یک نظام کاربردی جزء هدف این پروژه قرار گرفت، پروژه را با سه مطالعه مقدماتی آغاز کردیم:

اول، وضعیت منابع دیداری شنیداری و خصیصه های آنها از طریق یک پیمایش وبی گردآوری و سپس برای ماهیت بخشیدن به اهدافمان مورد تجزیه و تحلیل قرار گرفت.

دوم، نیازهای کاربران عمومی و مدیران به دقت از طریق پرسش نامه مورد بررسی قرار گرفت.

سوم، شیوه ها و پروژه های فراداده ای موجود برای بدست آوردن یک راهکار مورد بررسی و تفحص قرار گرفت.

در مرحله مقدماتی یافته های سودمند و مناسبی حاصل شد که در بخش های 3 و 4 و 5 به ترتیب یافته های مهم شرح داده می شود. سپس مجموعه فراداده منابع دیداری شنیداری بر اساس استاندارد فراداده ای دابلین کور تولید و اصلاح گردید. در بخش 6 نگاهی کلی به این مجموعه و محتوای آن که بر منابع ویدئویی تمرکز دارد شده است. همچنین این مجموعه فراداده ای دیداری شنیداری حاوی دو بخش تخصصی دیگر برای سوابق نواری و عکس هاست که در اینجا به دلیل طولانی بودن آورده نشده است. تحلیل های کامل این منابع را می توانید در گزارش پروژه ما ببینید.

3- ویژگی های منابع دیداری شنیداری

تنوع و گوناگونی محمل های رسانه ای به این معناست که منابع اطلاعاتی از نظر قالب، محیط ذخیره سازی و تجهیزات بازخوانی خصوصیات متفاونی دارند. انواع محمل های منابع دیداری شنیداری حاوی متن، عکس، فیلم و صداست. چند رسانه ای ها صفاتی دارند و منابع دیداری شنیداری نیز دارای خصوصیات زیر هستند:

3-1-  حجم انبوه، افزایش سریع

3-2- تنوع محمل ها، گوناگونی قالب ها

رسانه های ذخیره سازی منابع دیداری شنیداری واقعا شرایط بغرنجی دارند. دی وی دی، ال دل، وی سی دی، نوارهای ویدئویی با ویژگی های متنوع، سی دی، رکوردینگ ها، نوارهای صدا و نوارهای مغناطیسی پرکاربردترین رسانه های مورد استفاده اند. با این حال دی وی دبلیو، ام آی آی، دی وی سی، اس ایکس، دی اس، نوارهای دیجیتالی استریمینگ و هارد دیسک ها نیز در بازار وجود دارند. محتوای این رسانه های ذخیره ساز می تواند برحسب نیاز به قالب های گوناگون فشرده سازی نظیر تیف، گیف، جی فیف و پیکت تبدیل گردد.

3-3- پراکندگی بسیار بالای سازمان های گردآورنده، موجودی های عظیم

منابع دیداری شنیدرای با افزایش سرعت تولید و بالا رفتن نیازهای کاربران از سوی سازمان های بسیاری گردآوری می شود. بر اساس آمار پروژه "چه میزان اطلاعات" که به توسط مدرسه مدیریت اطلاعات و نظام ها در یو سی برکلی (2001) انجام پذیرفت، حجم مخازن فیلم های جهان 368530، یعنی 781 پتابایت (000/000/000/000/000/1 بایت یا 1015 بایت. تمامی منابع چاپی در حدود 200 پتابایت)، میزان عکس ها (000/000/900) معادل 4500 پتابایت برآورد شد. حجم نوارهای مغناطیسی نیز 1000 پتابایت؛ نوارهای ویدئویی آنالوگ 6400 پتابایت که با کپی های آن نزدیک به 62351 پتابایت برآورد شد. مخازن نوارهای دیجیتالی نیز 1250 پتابایت؛ سی دی ها و دی وی دی ها نیز متجاوز از 1000 پتابایت برآورد شد.

3-4- ویژگی های خاص، مشکل جدی سازمان های اطلاعاتی

 خصوصیات فیزیکی و پدیدآورندگان منابع دیداری شنیداری در مقایسه با سایر منابع اطلاعاتی، بویژه سوابق فیلم ها، بسیار پیچیده و بغرنج است. در سوابق ویدئویی، اطلاعاتی همانند عنوان، پدیدآور (نطیر هنرپیشه، خواننده، بازیگر، گوینده، کارگردان، و جزء آن)، و مکان تهیه، نام تهیه کننده، تاریخ تهیه، زمان و سیستم نمایش با هم ادغام می شوند.

وضعیت سوابق ویدئویی متعلق به ایستگاههای تلویزیونی حتی از این هم بغرنجتر است. این منابع حتی سطرهای عنوان و همچنین سطرهای فرعی عنوانی نیز ندارند. علاوه بر این برخی سطرهای فرعی برای هر برنامه در تاریخ معینی یک عنوان ویژه دارند. برای مثال، تلویزیون مرکزی چین ستونی دارد با عنوان "زمان مکان شرقی" که به ترتیب سه ستون فرعی با نام های "مردمان شرق"، "پخش زنده" و "داستان های مردم عامه" دارد. تحت عناوین هر ستون فرعی عنوان منحصر بفرد دیگری برای هر برنامه داده شده است.

 در شرایطی که منابع اطلاعاتی دیداری شنیداری به سرعت در حال افزایش است، استانداردهای فراداده ای عمومی موجود، دیگر برای این نوع منابع پاسخگو و مناسب نیست. قواعد فهرستنویسی و استانداردهای فراداده ای برای این قبیل منابع اکنون یکی از نیازهای مبرم و اساسی است. این مشکل بزرگترین مانع برای جستجو و بازیابی است. آن همچنین صنعت فیلم و تلویزیون چین را دچار محدودیت کرده است. هدایت تمامی این مشکلات به چگونگی توصیف و ارائه منابع دیداری شنیدای وابسته است تا این که کارآیی استفاده از آنها افزایش پیدا کند، موضوعی که مبحث داغ متخصصان اطلاعاتی و پژوهشگران داخلی و خارجی است.

4- نیازهای استفاده کنندگان

ایدئولوژی کاربرمدارانه در پژوهش های اخیر همه گیر شده است. گردآوری نیازهای اطلاعاتی نتایج عظیمی درپروژه ما داشته است. 600 پرسش نامه (300 پرسش نامه سازمانی به ایستگاههای تلویزیونی اصلی، کتابخانه ها و مراکز اطلاعاتی؛ و 300 پرسش نامه نیز بصورت تصادفی به کاربران حقیقی ارسال شد) و 150 پرسش نامه دریافت گردید.

5- بررسی فراداده های موجود و پروژه های وابسته در چین

از دهه هفتاد میلای به این طرف اقبال و توجه به منابع دیداری شنیداری بیشتر شده است. ایفلا در سال 1973 میزگردی در این خصوص ترتیب داد (که در سال 1999 به بخش دیداری شنیداری و چندرسانه ای تغییر نام داد) و مطالعات بسیاری را درباره این قبیل منابع و حوزه های مرتبط در بسیاری از کشورها انجام داد. برخی از پروژه های موثر جهانی نظیر پروژه اینفور مدیا[1]، پروژه نمونه سازی دیداری شنیداری، پروژه ویدئوی باز، مقوله هایی برای توصیف آثار هنری، تصویر استرالیا، و کتابخانه های بین المللی چندرسانه ای دیجیتالی از آن جمله اند.

سازمان های گردآورنده منابع دیداری شنیداری در چین عمدتا مراکز آرشیوی ایستگاههای تلویزیونی، بخش های دیداری شنیداری مراکز اطلاعاتی و کتابخانه ها (بویژه کتابخانه های بزرگ و برخی کتابخانه های دانشگاهی) هستند. برخی کتابخانه ها در چین (برای مثال کتابخانه دانشگاه پکینگ و کتابخانه شانگهای) برای ارائه منابع دیداری شنیداری خود از سی ان مارک[2] استفاده می کنند. کتابخانه ملی چین و کتابخانه گوانگزو ایالت گوانگدان نظام های مدیریتی ویژه ای را برای اطلاعات دیداری شنیداری خود ترتیب داده اند. تا آن جا که ما می دانیم چارچوب فراداده ای آنها خیلی ابتدایی است (آن شامل برخی اطلاعات پایه نظیر عنوان، پدیدآور، اطلاعات انتشار، قیمت و نوع است) و قادر نخواهد بود اطلاعات دیداری شنیداری پیچیده را به میزان کافی توصیف کند.

بسیاری از ایستگاههای تلویزیونی نیز نظام های مدیریت اطلاعات دیداری شنیداری خود را بوجود آورده اند، با این حال نبود یک الگوی فراداده ای دیداری شنیداری استاندارد و عمومی مشکلات بزرگی را در این حوزه پدید آورده است. این ها مسائلی بودند که وزارت خبرپراکنی، فیلم و تلویزیون چین در سال 2001 وادار کرد تا پژوهشی را درباره فراداده دیداری شنیداری آغاز کند. در 18 آگوست 2003 معیارهای فهرستنویسی منابع دیداری شنیداری تلویزیونی و خبرپراکنی منتشر شد. مواد فهرستنویسی به چهار سطح تقسیم شدند: سطح برنامه، سطح قسمت، سطح صحنه، سطح منظره (شات). با رجوع به فراداده دابلین کور 15 عنصر برای سطح برنامه؛ 12عنصر برای سطح قسمت؛ و به ترتیب 6 عنصر برای سطح صحنه و سطح شات  مشخص گردید.

در همان زمان چندین پروژه در تایوان در حال اجرا بود. دانشگاه هنر تایپه، موسسه اطلاع رسانی و مرکز رایانه ای دانشگاه مرکزی در حال اتمام پروژه ای با عنوان "موزه دیجیتالی دیداری شنیداری تایوان در علوم اجتماعی و انسان شناسی" بودند. تمرکز این پروژه در مراحل اولیه بر فیلم های حرفه ای 16 میلیمتری و نوارهای ویدئویی بتاکم بود و هدفش طراحی و ارائه یک پایگاه اطلاعاتی دیداری شنیداری رایگان، اشتراکی و جهانی به صورت الکترونیکی بود. در ابتدا آنها قصد داشتند یک نظام فراداده ای ایجاد کنند و اکو- گاهشماری اروپایی آنلاین- را به عنوان استاندارد برگزیدند و آن را بر اساس برخی شرایط تعدیل کردند. اکنون آنها "نظریه ای کلی درباره عناصر مواد دیداری شنیداری دیجیتال" را به پیش کشیده اند.

در مجموع پژوهش درباره فراداده منابع دیداری شنیداری در چین هنوز در مراحل اولیه قرار دارد. گذشته از این مشکل اصلی نبود استانداردهای فهرستنویسی یکسان، قواعد نمایه سازی موضوعی و رده بندی، و نبود عناصر فراداده ای استاندارد شده است. این پروژه به آرامی به مرحله بعدی یعنی توسعه مجموعه فراداده دیداری شنیداری حرکت نمود.

6- پژوهش ما درباره مجموعه فراداده دیداری شنیداری

6-1- اصول طراحی

با توجه به شرایط فعلی حوزه فراداده دیداری شنیداری، اصول طراحی ما در ابتدا به شرح ذیل قرار گرفت:

الف- اصل نیازهای کاربران. کسب رضایت مراجعان و مدیران (کتابداران، مدیران)، هدف نهایی ما تامین نیازهای عموم مراجعان و متخصصان است.

ب- اصل سادگی و کاربردپذیری. این اصل با کاربردی بودن و سهولت استفاده که یکی از مهمترین عوامل جذابیت دابلین کور است ارتباط دارد. سادگی فراداده دابلین کور در مقایسه با پیچیدگی مارک آن را کاربردی تر و سهل تر کرده است.

ج- اصل وسعت و عمق. همانطور که منابع دیداری شنیداری چندشکلی دارای خصوصیات متفاوتی هستند، نیازهای عموم مراجعان و متخصصان نیز بسیار متفاوت است. بنابراین ضروری است که بازنمود منابع مختلف با عمق و وسعت متفاوتی باشد. نظر به عناصر و توضیگر های فراداده ای باید ترکیب های اختیاری آنها نیز امکان پذیر باشد، چرا که هم برای منابع دیداری شنیداری قابل لمس (نظیر نوارهای ویدئویی، نوارهای رکوردینگ و تمامی لوح های فشرده) و هم برای انواع غیر قابل لمس آن (نظیر قسمت ها یا صحنه های ویدئویی) سودمند باشد. این اصل امکان بازیابی کارآمد منابع را امکان پذیر می سازد و با آشکار ساختن لایه های چندگانه مواد به استفاده کنندگان در انتخاب و استفاده از منابع کمک می کند.

د- اصل گسترش پذیری و گشودگی. تاکنون فقط یک مجموعه فراداده ای توانسته است منابع دیداری شنیداری محدودی را بازنمایی کند. باید برخی از نیازهای تخصصی و حرفه ای را با انتخاب عناصر و توضیحگرهای معین یا تدارک عناصری جدید بطور مجزا مورد بررسی قرار داده و به آنها پاسخ گفت. پس مجموعه فراداده ای ما باید باز و گسترش پذیر باشد تا این نوع گسترش امکان پذیر باشد.

ه- اصل میانکنش پذیری. "قابلیت میانکنش پذیری فراداده ای متضمن این است که آن فراداده از قابلیت میانکنش پذیری در بین نظام های گوناگون فراداده ای پشتیبانی کند." مجموعه فراداده ای ما باید با نظام های کاربردی خودش با سایر کاربردهای سازمانی تناسب داشته باشد. پذیرش دابلین کور، هم در ساختار نحوی و هم در ساختار معنایی، تا حدی این امکان را فراهم آورده است.

6-2- لایه های توصیف منابع دیداری شنیداری

 توصیف منابع دیداری شنیداری به سه لایه تقسیم می شود: لایه مجموعه، لایه اختصاصی و لایه تحلیلی (در تصویر 1 نمایش داده شده است). فروست نوارهای ویدئویی، نظیر فروست/ فروست فرعی سنتی، تک نگاشت و قسمت- تحلیلی، به عنوان لایه مجموعه نشان داده می شود؛ یک نوار مجزا (داستان واحد) از همان فروست به عنوان یک لایه اختصاصی و صحنه های همان نوار به عنوان لایه های تحلیلی نشان داده می شوند. نوارهای ویدئویی که بصورتی مجزا منتشر می شوند لایه های توصیفی متفاوتی نیز دارند. در مورد برنامه های تلویزیونی، لایه تحلیلی می تواند برش خاصی از یک برنامه مجموعه نمایش تلویزیونی، یا اجرای آوازی از یک موسیقی شبانه باشد.

 6-3- مجموعه فراداده دیداری شنیداری

با رجوع به عناصر و توضیحگر های فراداده دابلین کور، مجموعه فراداده دیداری شنیداری ما روی هم رفته 15 عنصر و 84 توضیحگر را نشان می دهد. این عناصر بر اساس معیارها و استاندارد های عناصر داده ای ISO.IEC 11179 در 9 ویژگی مشخص شده اند؛ آن ویژگی ها عبارتند از: نام، شناسه، نسخه، زبان، تعریف، الزام، نوع داده، بیشترین رخداد و توضیح. از آنجا که ترسیم معیارها در اینجا به دلیل طویل بودن امکان پذیر نیست، با فهرست کردن عناصر 15 گانه و توضیحگرهای مورد استفاده برا ی ویدئوها، نگاهی کلی به آن ها می اندازیم:

عناصر: عنوان، پدیدآور، موضوع و کلیدواژه ها، توصیف، ناشر، همکار، تاریخ، نوع منبع، قالب، شناسگر منبع، منشاء، زبان، رابطه، مدیریت حقوق و توصیف فیزیکی. این عناصر برای عکس ها، اطلاعات شنیداری و ویدئوها یکسان است. مجموعه فراداده ای ما در مقایسه با عناصر دابلین کور، عنصر "توصیف فیزیکی" را به عناصر، اضافه کرده و عنصر "پوشش" را حذف می کند و لذا تعداد عناصر به همان میزان باقی می ماند.

لایه های توصیف منابع دیداری و شنیداری

لایه مجموعه (گروهی از عکس ها)،‌

لایه اختصاصی (عکسی از یک گروه)،

لایه تحلیلی (منظره ای از یک عکس)

توضیحگرها برای منابع دیداری شنیداری مختلف طراحی می شوند و به عنوان توضیحگرهای عنصر و توضیحگرهای دستورالعمل سیستم دسته بندی می گردند. توضیحگرهای چندی با تعاریف و کاربردهای یکسان به عنوان توضیحگرهای دابلین کور، نظیر "جایگزین" برای عنصرِ "عنوان"، "وسعت" برای عنصرِ "قالب" و نظایر آن وجود دارند. لیکن بیش از 60 درصد توضیحگرها بمنظور منطبق کردن انواع مختلفی از مواد دیداری شنیداری، اضافه و یا تعدیل شدند. ما آن توضیحگرهایی را که مختص ویدئوهاست به تفصیل بیان خواهیم کرد (تعریف دقیق و کاربرد آنها را می توانید در گزارش پروژه ما ببینید. توضیحگرهای بدون یادداشت همگی توضیحگرهای عنصر هستند):

-         توضیحگرهای عنصر "توصیف"، شامل: یادداشت ها، چکیده ها، مخاطب، جوایز، فهرست مندرجات، نسخه، نوع رنگ، محل فیلمبرداری، حرکت دوربین، محدوده صحنه، زاویه دوربین، محل مجموعه، و موسسه نگهدارنده.

-         توضیحگرهای عنصر "تاریخ" شامل: تولید، توزیع، اصلاح، معتبر، انتشار، ساخت، کپی رایت، اولین پخش، پخش، فیلمبرداری.

-         توضیحگرهای عنصر "زبان" شامل: قطعه، زیرنویس و ایزو 2-639 (توضیحگر نظام کدگذاری).

-          توضیحگرهای عنصر "مدیریت حقوق" شامل: سطح محرمانه، مالک، نوع، شرح، استفاده کننده، حدود مجاز، پایان محدودیت، کاربری، و زمان.

-         توضیحگرهای عنصرِ "توصیف فیزیکی" شامل: اندازه اثر، مدت پخش، نقطه شروع، نقطه پایان، سیستم، نسبتِ تصویر، مشخصات اختصاصی تصویر، مشخصات صدا، ساختار شیار، رنگ، سرعت تصویر، و حجم.

دو مثال ذیل نمونه های ساده ای هستند که کاربرد مجموعه فراداده دیداری شنیداری را به تصویر می کشند.

نمونه 1: پیشینه لایه اختصاصی یک اثر ویدئویی

-         عنوان:

-         پدیدآور {فردی}: ----- ، ------

-         پدیدآور {فردی}: ----- ، ------

-         پدیدآور {فردی}: ----- ، ------

-         نوع:

-         ناشر {محل تولید}:

-         ناشر {نام تولید کننده}:

-         تاریخ {تولید}: 01-01-1997

-         توصیف فیزیکی {اندازه اثر}: 1----

-         توصیف فیزیکی {مدت پخش}: 94 دقیقه

-         توصیف فیزیکی {رنگ}:

-         توصیف فیزیکی {نقطه شروع}:

-         توصیف فیزیکی {نقطه پایان}:

-         توصیف فیزیکی {سیستم}: پال

-         زیان {تراک}: چینی

-         توصیف {یادداشت ها}: 10 1997 -------

-         توصیف {چکیده ها}--------

-----------------------------

-         توصیف {مکان فیلمبرداری}:

-         تاریخ {فیلمبرداری}: 01-01-1997

-         توصیف {محل مجموعه}:

-         توصیف {موسسه نگهدارنده}:

-         مدیریت حقوق {مالک}:

-         مدیربت حقوق {حدود مجاز}:

-         مدیریت حقوق {پایان محدودیت}: 01-11-2002_ 00-00-0000

نمونه 2: پیشینه تحلیلی یک اثر ویدئویی

-         عنوان:

-         پدیدآور {فردی}: ----- ، ------

-         پدیدآور {فردی}: ----- ، ------

-         پدیدآور {فردی}: ----- ، ------

-         نوع:

-         توصیف فیزیکی {نقطه شروع}: 00:36:52:00

-         توصیف فیزیکی {نقطه پایان}: 00:39:40:00

-         توصیف {چکیده ها}--------

-         توصیف {مکان فیلمبرداری}:

-         توصیف {تاریخ فیلمبرداری}: 01-01-1997

-         ارتباط {بخشی است از}:

-         توصیف {مکان مجموعه}:

-         توصیف {موسسه نگهدارنده}:

-         شناسگر {شماره راهنما}: S000007

7 جمع بندی و فعالیت های آتی

مجموعه فراداده دیداری شنیداری صرفا هدف اولیه پروژه ما است. مواد مورد نظر، سه نوع ماده دیداری شنیداری (اطلاعات صدا، ویدئوها و عکس ها) است که نماینده بقیه مواد نیز می باشند. با توجه به ویژگی های منابع مختلف و ارتباط بین آن منابع و اجزاء شان، عناصر و توضیحگرها را دقیقا بر اساس دابلین کور تعریف کردیم؛ سپس به منطور سهولت استفاده از عناصر و توضیحگرهایی که بعدا به مجموعه اضافه شدند آنها را بطور واضح مشخص نمودیم. نیازهای کاربران عام و کاربران حرفه ای با انعطافی که مجموعه ما دارد برآورده خواهد شد.

انطباق مجموعه ما با دابلین کور و مارک (سی ان مارک و یو اس مارک) بصورت فرمی در گزارش کامل ما فهرست شده است. این کار مبنایی برای میانکنش پذیری آنی در بین مجموعه فراداده های مختلف خواهد بود.

هدف غایی پروژه تامین نیازهای کاربران (عادی و حرفه ای) و تسهیل بازنمود و مدیریت منابع دیداری شنیداری است که برای رسیدن به آن باید وظایف بسیار سنگینی را انجام داد. کار هنوز در مرحله اجراست و چارچوبی که بصورت منطقی (مجموعه فرادداده) توسعه یافته، به تغییر نیاز دارد تا بتوان آن را در نظام های کاربردی بکار گرفت.

منبع: 

-Minglian, Duan, Xingxing, Yao & Zhang Jiuzhend. (2004) A Study on Audiovisual Metadata.{online available}: dublincore.org/index.php/pubs/article/download/776/772



[1] - Informedia Project

[2] - CNMARK