استخراج جدول PDF

جدول‌ها را از اسناد PDF به Excel یا CSV استخراج کنید. استخراج‌کننده جدول PDF دقیق با شناسایی هوشمند.

فایل خود را بارگذاری کنید.

پشتیبانی از: .pdf (حداکثر 100MB)

or press ⌘/Ctrl+V to paste a file

تشخیص جدول هوشمند

خروجی Excel XLSX

پشتیبانی از سلول‌های ادغام شده

جداول چند صفحه‌ای

مناسب برای

استخراج گزارش‌های مالی
تحلیل داده
مهاجرت صفحه‌گسترده
جمع‌آوری داده‌های تحقیقاتی

سوالات متداول

سوالات رایج درباره استخراج جدول pdf

استخراج‌کننده ما از الگوریتم‌های هوشمند برای شناسایی ساختارهای جدول در اسناد PDF استفاده می‌کند. این سیستم به‌طور خودکار ردیف‌ها، ستون‌ها، مرزهای سلول و سلول‌های ادغام‌شده را شناسایی می‌کند. هم جداول با مرز و هم جداول بدون مرز با تراز ستون به‌دقت شناسایی و استخراج می‌شوند.

جداول استخراج و به عنوان فایل‌های Excel (XLSX) ذخیره می‌شوند و ساختار ردیف و ستون را حفظ می‌کنند. هر جدول شناسایی‌شده به یک ورق کاری تبدیل می‌شود، که کار با داده‌ها را در Excel، Google Sheets یا هر برنامه صفحه‌گسترده‌ای آسان می‌کند. همچنین می‌توانید به فرمت CSV صادر کنید.

بله، استخراج کننده به سلول های ادغام شده، هدرهای چند ردیفی، جداول تو در تو و طرح های پیچیده رسیدگی می کند. این ساختار منطقی جدول را حفظ می کند، از جمله دامنه های ستون و دامنه های ردیف، بنابراین داده های استخراج شده سازماندهی اصلی خود را در خروجی صفحه گسترده حفظ می کند.

اعداد با دقت و فرمت اصلی خود استخراج می‌شوند. نمادهای ارزی، درصدها و مقادیر اعشاری حفظ می‌شوند. با این حال، از آنجا که PDFها فرمول‌های زنده ندارند، فقط مقادیر نمایش داده شده استخراج می‌شوند. می‌توانید پس از استخراج، فرمول‌های خود را در Excel اضافه کنید.

برای PDFهای اسکن شده، استخراج‌کننده از OCR برای شناسایی متن استفاده می‌کند، سپس ساختارهای جدول را شناسایی می‌کند. دقت به کیفیت اسکن بستگی دارد — جداول با وضوح بالا و چاپ شده به‌وضوح بهترین نتایج را ارائه می‌دهند. اسکن‌های بسیار کج یا جداول دست‌نویس ممکن است به‌طور دقیق استخراج نشوند.

هیچ محدودیتی در تعداد جداول استخراج شده وجود ندارد. این ابزار هر صفحه را اسکن کرده و تمام ساختارهای جدول را شناسایی می‌کند. اسنادی با ده‌ها جدول — مانند گزارش‌های مالی، مقالات تحقیقاتی یا کاتالوگ‌های داده — به طور کامل پشتیبانی می‌شوند. هر جدول در یک ورق جداگانه قرار می‌گیرد.

استخراج‌کننده می‌تواند جداولی را که در صفحات شکسته ادامه دارند شناسایی کرده و آن‌ها را به یک جدول پیوسته واحد در خروجی ادغام کند. سرصفحه‌هایی که در هر صفحه تکرار می‌شوند به طور هوشمندانه‌ای مدیریت می‌شوند تا از تکرار در داده‌های استخراج‌شده جلوگیری شود.

برای جداول به‌خوبی ساختار یافته با مرزهای واضح، دقت معمولاً 98-100% است. جداول بدون مرز با تراز ستون‌های منظم نیز به‌خوبی استخراج می‌شوند. طرح‌های پیچیده با فاصله‌های نامنظم یا گرافیک‌های گنجانده شده ممکن است گاهی نیاز به تنظیمات جزئی دستی در صفحه‌گسترده خروجی داشته باشند.

Create AI slides from your file

Upload PDFs, documents, or decks in ChatSlide and turn them into polished presentations.

Create slides with AI