Picture1

شناسایی انجمن‌ها در داده‌های عظیم

انجمن‌ها به عنوان عوامل پنهان در ایجاد ارتباطات افراد در شبکه‌های اجتماعی همواره نقش کلیدی در بهبود عملکرد شبکه‌ی اجتماعی نظیر پیشنهاد دهی و دسته بندی افراد داشته است. در ارائه‌ی پیش رو روشی معرفی گردیده است که بتواند علاوه بر شناسایی انجمن‌های با کمترین هم پوشانی با یکدیگر انجمن‌هایی که همپوشانی زیاد و در[…]

معرفی یک نرم‌افزار آماری برای تحلیل داده‌های زمانیtemporal، مکانی spatial و زمان مکانی.

نرم‌افزار SaTScan آموزش کار با نرم‌افزار SaTScan یک مثال کاربردی از این نرم‌افزار برای شناسایی مکان‌های بروز رویداد شیوع بیماری سرطان

Item Similarity

محتواهای مربوط به مشابهت آیتم‌ها در این محتواها سه تکنیک مکمل برای شناسایی آیتم‌ها معرفی گردیده است. تکنیک‌ها عبارتند از: Shingling Minhashing Locality sensitive hashing (LSH)   دانلود مقاله دانلود ارائه

Untitled-design-91-672x350

معرفی import.io

import.io یک خزشگر است که برای استخراج داده‌ها با ساختار جدولی(structural data) از سایت‌های بسیار مناسب می‌باشد. در واقع این نرم‌افزار دو کار بسیار مهم انجام می‌دهد. ۱. داده‌ها را از سایت‌ها استخراج می‌کند. ۲. آن‌ها را در ساختار جدول به کاربر ارائه می‌دهد. import2

MapReduce

BEHIND THE MAP REDUCE _ تکنیک نگاشت کاهش در موازی سازی الگوریتم‌ها

یک الگوریتم به ازای حجم مشخصی از داده مقیاس پذیر است اگر بتوان در زمان معقول و قابل اجرایی نتیجه‌ی آن را دریافت کرد. در گذشته الگوریتم‌های از مرتبه‌ی زمانی چند جمله‌ای را الگوریتم‌های مقیاس پذیر معرفی می‌کردند ولی این الگوریتم‌ها در برابر داده‌های عظیم نمی‌توانند مقیاس پذیر باشند. برای حل این مسأله چند راهکار[…]