بایگانی

نوشته های برچسب زده شده ‘search engine’

لایک برای جستجوی بهتر در وب

یک محتوای ساده که لایک خورده است تصویر زیدان، پله، مارادونا و فوتبال دستی در فرندفید و ۲۲ تا لایک. شاید به نظرتون عجیب باشه ولی همین لایک‌ها در آینده‌ای نه چندان دور به جستجوی بهتر در وب کمک می‌کنند.

اگر مطالب این وبلاگ رو دنبال کرده باشید، حتماً‌ متوجه شدید که یکی از زمینه‌های علاقه من جستجو هست. پیشتر در نوشته نرم افزار وحید آنلاین،به جستجوی ذخیره شده اشاره کردم، حالا به یکی از ابزارهایی که به جستجوی شخصی شده کمک می‌کنه اشاره می‌کنم: Like.

جستجوی ذخیره شده یک روش دستی برای تعیین محدوده مطالب مورد علاقه هست، شما با مشخص کردن چند کلمه کلیدی و چند پارامتر مثل تعداد لایک یا تعداد کامنت می‌تونید یک view شخصی از اطلاعات درست کنید. لایک زدن اما کمک می‌کنه تا نرم‌افزارها با آنالیز مطالبی که شما لایک زدید، محدوده اطلاعات مورد علاقه شما رو با الگوریتم‌های خاصی تشخیص بده.

مطالب چطور آنالیز می‌شوند؟ قبلاً درباره آینده جستجو در وب گفته بودم که:

در آینده جستجو بر اساس درک ماشین از معنا و مفهوم اطلاعات شکل می‌گیرد: وب معنایی.
نرم‌افزارهای امروز درکی از معنای اطلاعات ندارند، آن‌ها تنها در یک بانک اطلاعاتی که به اطلاعات به شکل یک رشته نگاه می‌کند به دنبال کلمات کلیدی که کاربر وارد کرده می‌گردند، اما اگر نرم‌افزارها بتوانند معنای اطلاعات را بفهمند، جستجو در میان اطلاعات ساده‌تر، دقیق‌تر و کاراتر می‌شود.

در واقع اگر وب معنایی قرار هست اطلاعات روی وب رو برای ماشین‌ها قابل فهم کنه، لایک ابزاری هست که به نرم‌افزارها امکان می‌ده که در میان محتوای مورد علاقه کاربر جستجو کنند.

You like thisبزرگان عرصه لایک

بدون شک فیس بوک و گوگل بزرگترین‌ها در عرصه ایده لایک هستند. فیس بوک ضمن اینکه لایک‌های کاربران خودش و فرندفید (که خریداری کرده) رو داره، عملاً با اضافه کردن امکان لایک به همه محتوای وب، خیلی خوب می‌تونه موضوعات مورد علاقه کاربران رو بدست بیاره.

گوگل هم که با انبوه سرویس‌ها و کاربرانش عملاً از هر چیزی که شما در وب ممکنه بهش علاقه داشته باشید با خبر هست: از جستجوهای مورد علاقه شما تا ویدئوهای favorite شده در یوتیوب یا buzz های لایک زده شده.

همین حالا دیگ و فیس بوک آگهی‌هایی رو نمایش می‌دهند که شما می‌توانید به اون‌ها رای بدید/لایک بزنید. فکر می‌کنید چند سال دیگه طول می‌کشه تا کلمات کلیدی که جستجو می‌کنید در بین محتوای مورد علاقه‌تون جستجو بشه یا نتایج بالاتر، واقعاً‌ نتایج جستجوی مورد علاقه شما باشند؟

چالش‌های لایک

تا اینجا همه چیز به نظر خوب میاد اما لایک زدن با مسائلی هم روبروست. در حال حاضر سیستم‌های مبتنی بر رای/اشتراک گذاری/لایک کاربران روی وب با مساله تقلب (چه به صورت تقلب نرم‌افزاری از طریق رباتهای نرم افزاری و چه به صورت تقلب سازمان یافته کاربران از طریق تشکیل شدن مافیا) روبرو هستند. اگر معیارهای موتورهای جستجو برای تعیین محدوده جستجو یا میزان اهمیت یک نتیجه جستجو بر مبنای ایده‌هایی نظیر لایک قرار بگیره همیشه با افراد و شرکت‌هایی روبرو خواهیم بود که برای بالا آمدن در نتایج جستجو به این روش تقلب می‌کنند.

مساله مهم دیگه مساله privacy هست. اینکه شرکت‌ها یا سایت‌هایی با آنالیز فعالیت‌های کاربران در وب، سایت‌‌هایی که دیده‌اند، لایک‌های آنها، favorite هایشان  و… یک پروفایل از زندگی هر کاربر ایجاد کنند برای خیلی‌ها قابل قبول نیست.

خلاصه

موتورهای جستجو در چند سال اخیر با حجم بسیار زیاد داده روی وب مواجه شدند، با اضافه شدن صدا و ویدئو کار جستجو حتی سخت‌تر هم شده. وب معنایی کمک می‌کنه تا اطلاعات روی وب برای ماشین‌ها قابل فهم باشند ولی هنوز لازمه از میزان توجه کاربران به محتوای روی وب (از طریق رای/لایک/به اشتراک گذاری) برای تعیین اهمیت نتایج جستجو استفاده بشه.

مشکل جستجو و محتوای کم ارزش وب ۲

۲۷ مرداد ۱۳۸۸ ۱ دیدگاه

چند روز پیش در خبرها خواندم که همسر اوان ویلیامز (از موسسان توییتر) حتی موقع زایمان هم دست از توییت کردن برنداشته و لحظه به لحظه اخبار را توییت می‌کرده است.

یکی از توییتهای سارا در بیمارستان

صرفنظر از اینکه توییت کردن موقع زایمان (که سلامتی مادر و فرزند مهمتر از همه چیز است) تا چه اندازه لازم است، یک بار دیگر به نقشی که سرویس‌های وب ۲ در تولید محتوای کم ارزش و مشکلی که در جستجوی عمقی وب ایجاد می‌کنند فکر کردم.

ما امروز چطور جستجو می‌کنیم؟
به گوگل یا یک موتور جستجو دیگر می‌رویم، یک باکس جستجو، چند کلمه کلیدی وارد می‌کنیم (گاهی وقت‌ها به همراه چند عملگر جستجو)، در صفحه اول جستجو چیزی را که می‌خواهیم پیدا می‌کنیم یا نه، به هر حال جستجوی ما محصور به ارزیابی خودمان از محتوای چند کلمه‌ای است به صورت لینک‌های آبی زیرخط دار در صفحه نتایج جستجو می‌بینیم.

روش کار؟ گوگل و موتور جستجوهای دیگر عملاً چیزی را در بیرون جستجو نمی‌کنند. آن‌ها یک کپی از اطلاعات را در دیتابیس خود ذخیره می‌کنند و بعد به کمک الگوریتم‌های خاص خودشان در آن جستجو می‌کنند. برای همین است که همیشه می‌توانید در کش گوگل صفحات و وب سایت‌هایی پیدا کنید که دیگر وجود خارجی ندارند.

وب ۲: مشارکت کاربران در تولید محتوا
پیش از اینکه واقعاً سرویس‌های وب ۲ از مشارکت کاربران و share کردن اطلاعات بهره ببرند، وبلاگ‌‌ها و وبلاگ‌نویسان باعث گسترش محتوای آنلاین شدند.
با به وجود آمدن امکان مشارکت کاربران در تولید محتوا، از روش‌هایی مثل برچسب‌زنی و ارزشیابی (به کمک رای در سیستم‌هایی نظیر دیگ و بالاترین) برای پیدا کردن و نشانه‌گذاری محتوای مفید استفاده شد. اما این روش نیز به تدریج کارآیی خود را از دست می‌دهد. حجم اطلاعات به شدت در حال افزایش است و استفاده از روش‌های بازنشری تنها به کپی شدن (شامل کپی شدن خود اطلاعات یا نسخه تغییر یافته یا لینک اطلاعات) بیشتر و بیهوده منتهی می‌شود. این نسخه‌های کپی شده از اطلاعات روی وب تنها جستجوی عمقی در وب را مشکل‌تر می‌کند. نه موتور جستجوهای سنتی (با روش خزیدن و ایندکس کردن اطلاعات) و نه روش‌های جدید (تگ گذاری و نشانه‌دار کردن اطلاعات مفید) جوابگوی این حجم از اطلاعات نخواهند بود.

یک مثال: Twitter و محتوای بی ارزش
Twitter یک رسانه است. یک رسانه جدید برای رساندن صدای مردم. اما نزدیک نیمی از توییت‌های مردم بی‌اهمیت و بی‌ارزش هستند. در چنین شرایطی فکر می‌کنید پیدا کردن صدای واقعی مردم در میان انبوه توییت‌های بی‌ارزش و اسپم چقدر مشکل است؟ به موضوعات داغی که عموماً با تگ گذاری توییت‌ها (با استفاده از #) در سطح توییتر ایجاد می‌شوند دقت کنید، بعد از چند ساعت خیلی از توییت‌های کاملاً بی‌ربط با موضوع اما با تگ یک موضوع داغ را می‌توانید ببینید.
حالا اگر به دنبال چیزی باشید با این حجم از اطلاعات بی‌ارزش و اسپم فکر می‌کنید شانس موفقیت‌ چقدر است؟ این مشکل تنها در مورد متن نیست، امروز ما عکس و ویدئو و صدا را هم با روش‌ سنتی (جستجوی کلمات کلیدی یا برچسب و عنوان و …) پیدا می‌کنیم.

جستجوی آینده 
در آینده جستجو بر اساس درک ماشین از معنا و مفهوم اطلاعات شکل می‌گیرد: وب معنایی.
نرم‌افزارهای امروز درکی از معنای اطلاعات ندارند، آن‌ها تنها در یک بانک اطلاعاتی که به اطلاعات به شکل یک رشته نگاه می‌کند به دنبال کلمات کلیدی که کاربر وارد کرده می‌گردند، اما اگر نرم‌افزارها بتوانند معنای اطلاعات را بفهمند، جستجو در میان اطلاعات ساده‌تر، دقیق‌تر و کاراتر می‌شود. این چیزی است که می‌خواهم درباره‌اش بیشتر صحبت کنم: وب معنایی
این آینده در واقع خیلی هم از ما دور نیست، بخشی از زیرساخت مورد نیاز همین حالا هم فراهم است.

ادامه دارد…