در این مقاله قصد داریم استفاده از هندسه فراکتال را برای تقسیم بندی سیگنال های دیجیتال مورد بررسی قرار دهیم. یک متد تقسیم بندی بافت را معرفی خواهیم کرد که بر مبنای بعد فراکتال خواهد بود. با استفاده از این روش، تغییرات صورت گرفته در بافت موجود در امتداد یک سیگنال یا تصویر را می توان بر حسب تغییرات در بعد فراکتال توصیف کرد. با استفاده از تحلیل نوسانات فضایی در بعد فراکتال بدست آمده با استفاده از روش پنجره حرکتی مرسوم، یک سیگنال دیجیتال یا تصویری را می توان بر اساس بافت بخش بندی کرد؛ این همان اصل بخش بندی بعد فراکتال (FDS) می باشد.
در این مقاله، ما از این نوع بخش بندی بافت بر روی سیگنال های گفتار ایزوله شده استفاده خواهیم کرد. متد های مربوط به محاسبه بعد فراکتال را نیز با هدف تمرکز بر روی روشی که از تابع چگالی انرژی(FSDF) مربوط به سیگنال فراکتال مقیاس بندی تصادفی استفاده می کند، مورد بازبینی قرار خواهیم داد. FDS در یک سری سیگنال گفتار مختلف بکار گرفته شده است و نتایج آن برای واژه ها و مؤلفه های مجزا(مانند سایشی) که این واژه ها از آن بدست آمده است. به طور خاص، نشان داده شده است که سیگتال های گفتار پیش فیلترینگ با یک فیلتر گذر سطح پایین دارای شکل 1/K خواهند بود. این خصیصه باعث شده تا سطح اطمینانی از این روش در بخش بندی گفتار بدست آید که منجر به ارائه شِمای تطابق الگو شده که باید آنرا بر مبنای FDS به صورت انحصاری طراحی کرد.
تشخیص گفتار، یک دامنه جدیدی از سرویس های محاسباتی را که قابلیت های انسانی را توسعه میدهد معرفی کرده است، که از نیازمندی های اجتماعی آن به منظور افزایش بهره وری آن استفاده می کند. برای مثال تشخیص واژه مجزا، می تواند برای ثبت سیستم حمل در انبار ها و یا تشخیص و شمارش آیتم ها به منظور کنترل دارائی مفید باشد. این امر نیاز به یک وقفه کوتاهی در قبل و بعد از گفتار و سخن که باید به صورت کلی تشخیص داده شود، دارد[1]. به عبارت دیگر، این واژه ها به صورت مجزا بیان می شوند. توقف بین واژه ها باعث ساده شدن تشخیص خواهد شد، چرا که تشخیص نقاط نهایی را آسان میسازند.(مثلا شروع و پایان هر کلمه) و باعث کمینه شدن تأثیرات گفتار کلمات به صورت چسبیده پشت سر هم خواهد شد. علاوه بر این، واژه های مجزا به صورت دقیق تلفظ می شوند، چرا که نیاز برای توقف بین واژه ها باعث شده تا روانی گفتار با اختلال روبرو شده که در غیر اینصورت، باعث ترغییب تلفظ طبیعی تری و با سطح دقت کمتری خواهد شد.