آخرین اخبار

از کول‌بری تا کرامت مرزنشینی؛ ابتکار “کارگزار-کولبر” چگونه تجارت مرزی را متحول می‌کند؟ بازگشت خودروهای وارداتی به بازار؛ از کاهش تعرفه‌ها تا تنوع برندهای اقتصادی و لوکس حذف صفرها از پول ملی؛ اصلاح اسمی یا مسکن موقت برای اقتصاد فرسوده؟ از آفتاب تا دستگاه: بازگشت دوباره‌ی هنر خشک‌کردن میوه به خانه‌ها گرمای مزمن و تهدید خاموش برای آینده آموزشی: گزارشی از تأثیرات اقلیمی بر یادگیری دانش‌آموزان تب پزشکی، تبعید ناخواسته؛ وقتی رؤیای دکتر شدن جوانان را به مهاجرت تحصیلی سوق می‌دهد نقشه راه جدید تهران-اسلام‌آباد؛ سفر پزشکیان به پاکستان با محوریت امنیت، اقتصاد و همسایگی تمدنی ۳ هزار دستگاه اتوبوس کمکی و افزایش ظرفیت هوایی برای بازگشت زائران اربعین / نرخ مصوب بلیت هواپیما اعلام شد از ژنو تا غزه؛ تریبون جهانی ایران برای شکستن سکوت درباره جنایت‌های صهیونیست‌ها اینترنت رایگان در مسیر نجف تا کربلا؛ تحول ارتباطی در اربعین ۱۴۰۴

سپینو

5

دیتاست یک میلیون آگهی املاک «دیوار» متن‌باز منتشر شد

  • کد خبر : 1561
  • 29 فروردین 1404 - 18:58
دیتاست یک میلیون آگهی املاک «دیوار» متن‌باز منتشر شد
پلتفرم «دیوار» دیتاست یک میلیون آگهی املاک منتشرشده در این پلتفرم را در Hugging Face به صورت متن‌باز و گمنام‌سازی‌شده منتشر کرد. این دیتاست نخستین مجموعهٔ ساختارمند در حوزهٔ املاک به زبان فارسی محسوب می‌شود.

به گزارش وفاق ملی، این اطلاعات بخشی از آگهی‌هایی را در بر می‌گیرد که در میانه سال ۱۴۰۳ فعال بوده و از میان شهرها و محله‌های مختلف، به‌صورت تصادفی انتخاب شده‌اند. دیوار در توضیح این اقدام خود می‌گوید: «این دیتاست نخستین مجموعه ساختارمند در حوزه املاک به زبان فارسی محسوب می‌شود و از نظر حجم، کیفیت و تمیز بودن داده‌ها، ابعاد قابل توجهی دارد.»

دیوار تأکید می‌کند که «برای حفظ حریم خصوصی کاربرانش، تمامی اطلاعات شخصی که ممکن بود به شناسایی افراد منجر شود، از این دیتاست حذف شده و صرفاً داده‌هایی که خود کاربر اجازه انتشار آن‌ها را داده بود، منتشر شده است.»

این داده‌ها می‌تواند پایه‌ای برای تیم‌های پژوهشی، محققان دانشگاهی و استارتاپ‌های فعال در حوزه پراپ‌تک (Property Tech) ایران باشد که در زمینه توسعه و ساخت مدل‌های هوشمند تخمین قیمت، طراحی سیستم‌های توصیه‌گر ملک، تحلیل متن و استخراج کلیدواژه‌ها و پژوهش‌های مرتبط با اقتصاد مسکن فعالیت می‌کنند. این حجم داده برای تقویت مدل زبانی فارسی نیز کاربرد دارد و می‌تواند در توسعه ابزارهای هوش مصنوعیِ فارسی مؤثر باشد.

برای استفاده از این مجموعه داده می‌توانید به وب‌سایت Hugging Face مراجعه کنید.

لینک کوتاه : https://vefaghemelli.com/?p=1561
  • منبع : دیجیاتو
انفرادی