آخرین اخبار

بازی با انتظارات؛ سلاحی خاموش در روابط ایران و آمریکا انتشار فهرست ۲۹۸۶ جان‌باخته حوادث اخیر با دستور پزشکیان؛ تأکید دولت بر شفافیت و پاسخگویی وال‌استریت ژورنال: عربستان و امارات حاضر نیستند سکوی حمله آمریکا به ایران باشند پزشکیان: نارسایی‌های داخلی باید شفاف شناسایی شود | دستور رئیس‌جمهور برای گفت‌وگوی ملی و پرهیز از برخورد سلبی وزارت دادگستری: ممنوعیت قانونی برای رانندگی بانوان با موتورسیکلت وجود ندارد سه روایت از لشکرکشی آمریکا به خلیج فارس؛ سناریوهای جنگ، پاسخ سخت ایران یا توصیه به آرامش؟ افشای دروغ‌پردازی رسانه‌ای رژیم صهیونیستی؛ زن اسرائیلی «کشته‌شده در اعتراضات ایران» زنده از آب درآمد سناتور دلاور: توییت‌های نیمه‌شب ترامپ «تهدید توخالی» و خطرناک است؛ خواستار مذاکره با مادورو شد امکان خرید با کالابرگ الکترونیکی در تمامی میادین میوه و تره‌بار تهران فراهم شد وزیر ارتباطات: معیشت مردم خط قرمز دولت است / قطع اینترنت تصمیمی دائمی نیست

خانه فناوری

دیتاست یک میلیون آگهی املاک «دیوار» متن‌باز منتشر شد

کد خبر : 1561
29 فروردین 1404 - 18:58

پلتفرم «دیوار» دیتاست یک میلیون آگهی املاک منتشرشده در این پلتفرم را در Hugging Face به صورت متن‌باز و گمنام‌سازی‌شده منتشر کرد. این دیتاست نخستین مجموعهٔ ساختارمند در حوزهٔ املاک به زبان فارسی محسوب می‌شود.

به گزارش وفاق ملی، این اطلاعات بخشی از آگهی‌هایی را در بر می‌گیرد که در میانه سال ۱۴۰۳ فعال بوده و از میان شهرها و محله‌های مختلف، به‌صورت تصادفی انتخاب شده‌اند. دیوار در توضیح این اقدام خود می‌گوید: «این دیتاست نخستین مجموعه ساختارمند در حوزه املاک به زبان فارسی محسوب می‌شود و از نظر حجم، کیفیت و تمیز بودن داده‌ها، ابعاد قابل توجهی دارد.»

دیوار تأکید می‌کند که «برای حفظ حریم خصوصی کاربرانش، تمامی اطلاعات شخصی که ممکن بود به شناسایی افراد منجر شود، از این دیتاست حذف شده و صرفاً داده‌هایی که خود کاربر اجازه انتشار آن‌ها را داده بود، منتشر شده است.»

این داده‌ها می‌تواند پایه‌ای برای تیم‌های پژوهشی، محققان دانشگاهی و استارتاپ‌های فعال در حوزه پراپ‌تک (Property Tech) ایران باشد که در زمینه توسعه و ساخت مدل‌های هوشمند تخمین قیمت، طراحی سیستم‌های توصیه‌گر ملک، تحلیل متن و استخراج کلیدواژه‌ها و پژوهش‌های مرتبط با اقتصاد مسکن فعالیت می‌کنند. این حجم داده برای تقویت مدل زبانی فارسی نیز کاربرد دارد و می‌تواند در توسعه ابزارهای هوش مصنوعیِ فارسی مؤثر باشد.

برای استفاده از این مجموعه داده می‌توانید به وب‌سایت Hugging Face مراجعه کنید.

لینک کوتاه : https://vefaghemelli.com/?p=1561

منبع : دیجیاتو

انفرادی

اخبار مشابه

16دی

وزیر ارتباطات: معیشت مردم خط قرمز دولت است / قطع اینترنت تصمیمی دائمی نیست

وزیر ارتباطات: معیشت مردم خط قرمز دولت است / قطع اینترنت تصمیمی دائمی نیست

08دی

چرا فضا برای ایران مهم است؟ تحلیل راهبردی یک ضرورت ملی

چرا فضا برای ایران مهم است؟ تحلیل راهبردی یک ضرورت ملی

16آذر

ساخت سوکت سه‌بعدی بومی برای بیماران قطع عضو در دانشگاه صنعتی اصفهان

ساخت سوکت سه‌بعدی بومی برای بیماران قطع عضو در دانشگاه صنعتی اصفهان

ثبت دیدگاه

بازی با انتظارات؛ سلاحی خاموش در روابط ایران و آمریکا

بازی با انتظارات؛ سلاحی خاموش در روابط ایران و آمریکا

بهنام عبداللهی

چرا گشودن جبهه‌ای تازه علیه ایران، یک محاسبه پرهزینه برای واشنگتن است؟

چرا گشودن جبهه‌ای تازه علیه ایران، یک محاسبه پرهزینه برای واشنگتن است؟

بهنام عبداللهی

مدیریت تنش‌های اجتماعی در دولت پزشکیان؛ از پیشگیری تا اصلاح سیاست‌ها

مدیریت تنش‌های اجتماعی در دولت پزشکیان؛ از پیشگیری تا اصلاح سیاست‌ها

امیررضا آزاده

چگونه اسرائیل اعتراضات اجتماعی را به ابزار ژئوپلیتیک تبدیل می‌کند؟

چگونه اسرائیل اعتراضات اجتماعی را به ابزار ژئوپلیتیک تبدیل می‌کند؟

بهنام عبداللهی

وقتی بازار هشدار می‌دهد؛ دلار، اعتراض کسبه و ضرورت تدبیر پیش از بحران

وقتی بازار هشدار می‌دهد؛ دلار، اعتراض کسبه و ضرورت تدبیر پیش از بحران

بازی با انتظارات؛ سلاحی خاموش در روابط ایران و آمریکا

بازی با انتظارات؛ سلاحی خاموش در روابط ایران و آمریکا

15 بهمن 1404 - 11:17

انتشار فهرست ۲۹۸۶ جان‌باخته حوادث اخیر با دستور پزشکیان؛ تأکید دولت بر شفافیت و پاسخگویی

انتشار فهرست ۲۹۸۶ جان‌باخته حوادث اخیر با دستور پزشکیان؛ تأکید دولت بر شفافیت و پاسخگویی

12 بهمن 1404 - 18:46

وال‌استریت ژورنال: عربستان و امارات حاضر نیستند سکوی حمله آمریکا به ایران باشند

وال‌استریت ژورنال: عربستان و امارات حاضر نیستند سکوی حمله آمریکا به ایران باشند

08 بهمن 1404 - 23:48

پزشکیان: نارسایی‌های داخلی باید شفاف شناسایی شود | دستور رئیس‌جمهور برای گفت‌وگوی ملی و پرهیز از برخورد سلبی

پزشکیان: نارسایی‌های داخلی باید شفاف شناسایی شود | دستور رئیس‌جمهور برای گفت‌وگوی ملی و پرهیز از برخورد سلبی

08 بهمن 1404 - 22:11

وزارت دادگستری: ممنوعیت قانونی برای رانندگی بانوان با موتورسیکلت وجود ندارد

وزارت دادگستری: ممنوعیت قانونی برای رانندگی بانوان با موتورسیکلت وجود ندارد

08 بهمن 1404 - 18:26

سه روایت از لشکرکشی آمریکا به خلیج فارس؛ سناریوهای جنگ، پاسخ سخت ایران یا توصیه به آرامش؟

سه روایت از لشکرکشی آمریکا به خلیج فارس؛ سناریوهای جنگ، پاسخ سخت ایران یا توصیه به آرامش؟

07 بهمن 1404 - 23:00

افشای دروغ‌پردازی رسانه‌ای رژیم صهیونیستی؛ زن اسرائیلی «کشته‌شده در اعتراضات ایران» زنده از آب درآمد

افشای دروغ‌پردازی رسانه‌ای رژیم صهیونیستی؛ زن اسرائیلی «کشته‌شده در اعتراضات ایران» زنده از آب درآمد

07 بهمن 1404 - 17:55

سناتور دلاور: توییت‌های نیمه‌شب ترامپ «تهدید توخالی» و خطرناک است؛ خواستار مذاکره با مادورو شد

سناتور دلاور: توییت‌های نیمه‌شب ترامپ «تهدید توخالی» و خطرناک است؛ خواستار مذاکره با مادورو شد

16 دی 1404 - 17:45

امکان خرید با کالابرگ الکترونیکی در تمامی میادین میوه و تره‌بار تهران فراهم شد

امکان خرید با کالابرگ الکترونیکی در تمامی میادین میوه و تره‌بار تهران فراهم شد

16 دی 1404 - 2:46

وزیر ارتباطات: معیشت مردم خط قرمز دولت است / قطع اینترنت تصمیمی دائمی نیست

وزیر ارتباطات: معیشت مردم خط قرمز دولت است / قطع اینترنت تصمیمی دائمی نیست

16 دی 1404 - 0:27

اردوغان تصمیم آمریکا درباره خروج ترکیه از پروژه اف‑۳۵ را ناعادلانه خواند

اردوغان تصمیم آمریکا درباره خروج ترکیه از پروژه اف‑۳۵ را ناعادلانه خواند

15 دی 1404 - 22:15

فایننشال تایمز: مادورو پس از ربایش به نیویورک منتقل شد؛ محاکمه در دادگاه فدرال آمریکا

فایننشال تایمز: مادورو پس از ربایش به نیویورک منتقل شد؛ محاکمه در دادگاه فدرال آمریکا

15 دی 1404 - 20:02

تعطیلی مهدکودک‌ها و غیرحضوری شدن مدارس تهران؛ اجرای طرح زوج و فرد ۷۲ ساعته

تعطیلی مهدکودک‌ها و غیرحضوری شدن مدارس تهران؛ اجرای طرح زوج و فرد ۷۲ ساعته

15 دی 1404 - 19:07

آتش‌سوزی گسترده در واحد لبنیات شرکت کاله آمل؛ فعالیت مجتمع صنعتی متوقف شد

آتش‌سوزی گسترده در واحد لبنیات شرکت کاله آمل؛ فعالیت مجتمع صنعتی متوقف شد

15 دی 1404 - 17:46

هشدار درباره بیسفنول‌ها؛ مواد مختل‌کننده هورمون در رسیدهای خرید و ظروف پلاستیکی

هشدار درباره بیسفنول‌ها؛ مواد مختل‌کننده هورمون در رسیدهای خرید و ظروف پلاستیکی

15 دی 1404 - 8:01