بخش Live Labs مایکروسافت برنامه جدیدی به نام Pivot ارائه کرده که کار جستجو در حجم بسیار وسیع از اطلاعات را بسیار ساده میکند.
جستجوی بصری
اگر با Visual Search موتور جستجوی بینگ کار کرده باشید روش دسته بندی آن را دیدهاید. Pivot را میتوان یک Visual Search برای انواع و اقسام دادهها دانست. این دادهها میتوانند مجموعهای از تصاویر یا کل اطلاعات موجود روی بانک اطلاعاتی ویکی پدیا باشند! هنگام جستجوی بصری با Pivot به عنوان مثال وقتی موضوع جستجو یک بازه تاریخی باشد، شما میتوانید به کمک یک Slider به راحتی بازه خود را مشخص کنید.
Pivot میتواند اطلاعاتی که پس از اعمال انواع فیلترها باقی میمانند را به صورت جالبی نمایش دهد. شما میتوانید نمودار فراوانی اطلاعات را بر حسب فیلدهای مختلف ببینید. مثلاً من اطلاعات ۵۰۰ بازیگر برتر تاریخ سینما را بر اساس تاریخ تولدشان خواستم، نتیجه را در تصویر زیر میبینید.برای مشاهده در اندازه اصلی اینجا کلیک کنید.
وقتی که در نهایت دادههای مورد نظر خود را از بین انبوه دادهها پیدا کردید، به راحتی روی آنها زوم میکنید و با کلیک بر روی هر آیتم میتوانید خلاصهای از اطلاعات آن را ببینید یا حتی در موتور جستجوی بینگ در موردش جستجو کنید. برای مشاهده تصویر در اندازه اصلی اینجا کلیک کنید.
Pivot چطور کار میکند؟
روش کار به این صورت است که در Pivot تعدادی Collection وجود دارد که هر کدام از آنها ویژگیهای خاص خود را دارند. مثلاً Collection مربوط به فیلمها ویژگیهایی نظیر بازیگران،کارگردان، کشور سازنده، زمان فیلم و … دارد و بنابراین جستجوی بصری در این مجموعه بر حسب فیلدهای اطلاعاتی آن متفاوت با مثلاً مجموعه اطلاعات مربوط به ورزشکاران رشته بسکتبال است.
مجموعهها یا Collection های Pivot سه دستهاند: ساده، متصل (Linked) و پویا (Dynamic)، اطلاعات بیشتر درباره ساختار مجموعهها، تفاوت انواع مجموعهها با هم در حجم و میزان پیچیدگی دادهها، اطلاعات مربوط به معماری نرم افزار و … را میتوانید در این آدرس ببینید. همچنین اطلاعاتی درباره میزبانی کردن مجموعهها را میتوانید در اینجا ببینید.
برای آشنایی بیشتر با ایده Pivot و قابلیتهایش ویدئوی زیر را ببینید (برای مشاهده ویدئو به Silverlight احتیاج دارید):
چطور از Pivot استفاده کنیم؟
Pivot در حال حاضر در مرحله تست بتا قرار دارد و استفاده از آن تنها با دعوتنامه و کد نصب ممکن است. بعد از دانلود نرم افزار Pivot (با حجم تقریبی ۲۸ مگابایت) با دادن ایمیل خود، در این صفحه درخواست کد نصب کنید. پس از دریافت کد نصب میتوانید به راحتی نرم افزار را نصب و استفاده کنید. در صورتی که موفق به دریافت کد نصب نشدید من چند کد نصب دارم که میتوانم از طریق ایمیل برایتان ارسال کنم.
امروز به سایت Multicolr Search برخوردم که قابلیت جستجو تصاویر فلیکر بر اساس رنگ را فراهم میکند.
در این سایت با انتخاب رنگ یا رنگهای مورد نظر خود میتوانید تصاویری در فلیکر که تم رنگی مورد نظر شما را دارند پیدا کنید.
عملکرد این سایت مشابه قابلیت جدید جستجوی تصویر بر اساس رنگ در گوگل است با این تفاوت که Multicolr Search رنگهای ۱۰ میلیون تصویر جالب در فلیکر را استخراج کرده است. عملکرد Multicolr Search بسیار خوب و دقیق است. اگر به دنبال پیدا کردن عکسهای مناسب و هماهنگ با رنگبندی سایت خود هستید Multicolr Search برای شماست.
چند روز پیش در خبرها خواندم که همسر اوان ویلیامز (از موسسان توییتر) حتی موقع زایمان هم دست از توییت کردن برنداشته و لحظه به لحظه اخبار را توییت میکرده است.
صرفنظر از اینکه توییت کردن موقع زایمان (که سلامتی مادر و فرزند مهمتر از همه چیز است) تا چه اندازه لازم است، یک بار دیگر به نقشی که سرویسهای وب ۲ در تولید محتوای کم ارزش و مشکلی که در جستجوی عمقی وب ایجاد میکنند فکر کردم.
ما امروز چطور جستجو میکنیم؟ به گوگل یا یک موتور جستجو دیگر میرویم، یک باکس جستجو، چند کلمه کلیدی وارد میکنیم (گاهی وقتها به همراه چند عملگر جستجو)، در صفحه اول جستجو چیزی را که میخواهیم پیدا میکنیم یا نه، به هر حال جستجوی ما محصور به ارزیابی خودمان از محتوای چند کلمهای است به صورت لینکهای آبی زیرخط دار در صفحه نتایج جستجو میبینیم.
روش کار؟ گوگل و موتور جستجوهای دیگر عملاً چیزی را در بیرون جستجو نمیکنند. آنها یک کپی از اطلاعات را در دیتابیس خود ذخیره میکنند و بعد به کمک الگوریتمهای خاص خودشان در آن جستجو میکنند. برای همین است که همیشه میتوانید در کش گوگل صفحات و وب سایتهایی پیدا کنید که دیگر وجود خارجی ندارند.
وب ۲: مشارکت کاربران در تولید محتوا پیش از اینکه واقعاً سرویسهای وب ۲ از مشارکت کاربران و share کردن اطلاعات بهره ببرند، وبلاگها و وبلاگنویسان باعث گسترش محتوای آنلاین شدند. با به وجود آمدن امکان مشارکت کاربران در تولید محتوا، از روشهایی مثل برچسبزنی و ارزشیابی (به کمک رای در سیستمهایی نظیر دیگ و بالاترین) برای پیدا کردن و نشانهگذاری محتوای مفید استفاده شد. اما این روش نیز به تدریج کارآیی خود را از دست میدهد. حجم اطلاعات به شدت در حال افزایش است و استفاده از روشهای بازنشری تنها به کپی شدن (شامل کپی شدن خود اطلاعات یا نسخه تغییر یافته یا لینک اطلاعات) بیشتر و بیهوده منتهی میشود. این نسخههای کپی شده از اطلاعات روی وب تنها جستجوی عمقی در وب را مشکلتر میکند. نه موتور جستجوهای سنتی (با روش خزیدن و ایندکس کردن اطلاعات) و نه روشهای جدید (تگ گذاری و نشانهدار کردن اطلاعات مفید) جوابگوی این حجم از اطلاعات نخواهند بود.
یک مثال: Twitter و محتوای بی ارزش Twitter یک رسانه است. یک رسانه جدید برای رساندن صدای مردم. اما نزدیک نیمی از توییتهای مردم بیاهمیت و بیارزش هستند. در چنین شرایطی فکر میکنید پیدا کردن صدای واقعی مردم در میان انبوه توییتهای بیارزش و اسپم چقدر مشکل است؟ به موضوعات داغی که عموماً با تگ گذاری توییتها (با استفاده از #) در سطح توییتر ایجاد میشوند دقت کنید، بعد از چند ساعت خیلی از توییتهای کاملاً بیربط با موضوع اما با تگ یک موضوع داغ را میتوانید ببینید. حالا اگر به دنبال چیزی باشید با این حجم از اطلاعات بیارزش و اسپم فکر میکنید شانس موفقیت چقدر است؟ این مشکل تنها در مورد متن نیست، امروز ما عکس و ویدئو و صدا را هم با روش سنتی (جستجوی کلمات کلیدی یا برچسب و عنوان و …) پیدا میکنیم.
جستجوی آینده در آینده جستجو بر اساس درک ماشین از معنا و مفهوم اطلاعات شکل میگیرد: وب معنایی. نرمافزارهای امروز درکی از معنای اطلاعات ندارند، آنها تنها در یک بانک اطلاعاتی که به اطلاعات به شکل یک رشته نگاه میکند به دنبال کلمات کلیدی که کاربر وارد کرده میگردند، اما اگر نرمافزارها بتوانند معنای اطلاعات را بفهمند، جستجو در میان اطلاعات سادهتر، دقیقتر و کاراتر میشود. این چیزی است که میخواهم دربارهاش بیشتر صحبت کنم: وب معنایی این آینده در واقع خیلی هم از ما دور نیست، بخشی از زیرساخت مورد نیاز همین حالا هم فراهم است.