Improving accuracy, stability, and practicability of poverty-targeting tools in the context of  vietnamese ethnic minorities

Duong, Be Thanh

Doctoral Thesis

2025

Improving accuracy, stability, and practicability of poverty-targeting tools in the context of vietnamese ethnic minorities

Duong, Be Thanh

Dissertation_Be_Thanh_Duong.pdf (1.56 MB)

Abstract (English)

Poverty-targeting tools (PTTs) are essential tools used globally to identify households below established poverty benchmarks, such as food consumption or monetary standards, through simple and verifiable indicators. These tools enable social programs, ranging from cash transfers to healthcare and educational supports, to effectively and quickly deliver urgent support to the households most in need. However, despite the significant improvements made over time, current PTTs face some critical limitations that undermine their accuracy performance in both laboratory and field conditions. First, current efforts to enhance PTT accuracy through algorithmic improvements appear to be reaching a plateau. The Weight of Evidence (WOE) transformation technique has demonstrated success in optimizing the predictive power of input variables and potentially improving the accuracy of the prediction model across other domains, but this methodology remains underexplored in the poverty targeting field. Additionally, most existing PTTs lack transparent and user-friendly scoring systems. The score-scaling technique, doubling-the-odds, commonly paired with WOE in credit scoring, provides a logical and interpretable relationship between scores and outcome probabilities, yet it is rarely applied to the development of PTTs. Second, although the performance stability of PTTs is critical for ensuring their reliability and robustness in different datasets and real-world applications, this aspect remains insufficiently addressed in current research. Most existing studies rely on hold-out validation, which assesses the model’s performance based on a single random draw of a training-testing split. This approach offers limited insight into performance variability and restricts developers from making timely model adjustments. While k-fold cross-validation, a technique widely adopted in machine learning, offers a more comprehensive assessment of model stability and facilitates the fine-tuning of prediction models, this technique remains underutilized in poverty-targeting research. Third, the predictive accuracy of PTTs in the real world is significantly impacted by their practicability, namely the simplicity and verifiability of their indicators, but this aspect is often assumed rather than empirically validated. Currently, developers select indicators based on theoretical assumptions about simplicity and verifiability, without systematically validating these assumptions with frontline users. In addition, various contextual factors may influence the practicability of PTTs, ultimately affecting their overall predictive accuracy in practice. Despite this, no studies have thoroughly explored this dimension. To address these critical gaps, this dissertation aims to enhance the predictive performance of PPTs in both controlled research environments and real-world implementation settings. The research focuses on advancing fundamental dimensions of PTT effectiveness: technical accuracy, performance stability, transparency, and practicability. The research is situated in the context of ethnic minority communities in Vietnam, which experience the highest poverty rates and are a major concern for national poverty reduction programs. To achieve this overarching goal, this dissertation pursues the following interconnected sub-objectives: (1) Examine the efficacy of applying the WOE transformation method to improve the accuracy of PPTs; (2) Explore the combination of k-fold cross-validation with the WOE technique to ensure high and consistent performance PTTs with transparent and interpretable scoring systems; (3) Evaluate the practicability (simplicity and verifiability) of the PPTs and identify the key determinants impacting their practicability in field conditions, particularly in the context of Khmer communities in Southern Vietnam. These objectives are addressed through three scientific articles, presented respectively in Chapters 2 through 4 in this dissertation. The first research component of this dissertation is presented in Chapter 2, which examines the adaptation of the WOE technique in constructing high-accuracy PTTs. This research introduces a comprehensive approach, called the WOE (Logit) method, to develop PTTs based on international and national poverty lines. The WOE (Logit) method integrates the WOE technique with other techniques such as logistic regression, the indicator selection approach based on c-statistic value, and a score-scaling technique of doubling the odds. The resulting PTTs are evaluated against well-known methods such as the Simple Poverty Scorecard, Proxy Means Test, and Poverty Assessment Tool. The results show that the WOE (Logit) method yields higher accuracy, specifically improving identification rates by 1.9–5.9 percentage points for households and 1.5–3.3 percentage points for individuals. This finding contributes a valuable alternative methodology for more accurate poverty targeting. Chapter 3 explores the effectiveness of integrating k-fold cross-validation into the WOE (Logit) method in constructing high-accuracy and stable-performance PTTs with transparent scoring mechanisms for ethnic minorities in Vietnam (EMP tools). This research integrates a 5-fold cross-validation technique into the WOE (Logit) method to assess predictive performance and its variation. Two indicator selection strategies are compared based on the results of 5-fold cross-validation to find out the best prediction models, high-predictive power, and low performance variation, to develop EMP tools: one based on the highest c-statistic value (MaxC) and the other on the smallest Akaike Information Criterion (MinAIC). The results indicate that both indicator selection approaches yield high predictive power with minimal differences between them. However, the MinAIC approach shows a significantly lower performance variation in small urban datasets and remains slightly more stable in large rural datasets. Based on these results, MinAIC-based models are selected to design the EMP tools by applying the score-scaling technique of doubling-the-odds. Independent testing further validates this choice: the MinAIC models outperform their MaxC counterparts in terms of predictive power and standard error across rural and urban settings. When tested out-of-sample, EMP tools outperform the Vietnamese government’s current models while using one-third the number of indicators. Crucially, the EMP tools also feature a transparent and user-friendly scoring mechanism, which the government's tools lack. These results underscore the value of incorporating k-fold cross-validation to assess both accuracy and stability during model selection. Moreover, this study demonstrates that this integrated strategy effectively develops transparent PTTs with high accuracy and stable performance. The third article in Chapter 4 evaluates the practicability of the EMP tools developed in Chapter 3 through a field study in Khmer communities in the Vietnamese Mekong Delta. Employing both quantitative and qualitative methods, this study examines enumerators’ perceptions of indicator simplicity and verifiability. Quantitative data are analyzed using Likert scales, Factor Analysis, and Ordinary Least Squares regression, while qualitative data are analyzed using a thematic approach. The findings reveal a complex landscape of practicability that challenges conventional assumptions about indicator simplicity and verifiability. While EMP tools are generally perceived as practical, with over half of enumerators affirming the straightforwardness and verifiability of most indicators, significant variations exist across different types of indicators. Some commonly assumed simple indicators (e.g., cellphone ownership, job type) are rated low in verifiability, while more complex indicators (e.g., land ownership) are seen as more practical than anticipated. Qualitative insights highlight the vital role of local knowledge, particularly from village managers, in verifying high-risk indicators. The characteristics of enumerators (such as ethnicity, age, authority level of enumerators, and prior poverty-targeting experience) are significant determinants of overall tool practicability. These findings contribute a mixed-methods framework for pre-assessing PTT practicability and suggest solutions for improving tool practicability through more targeted enumerator selection. In sum, the dissertation achieves its three sub-objectives by demonstrating that: (1) the WOE (Logit) method enhances the predictive accuracy of PTTs; (2) Incorporating the k-fold cross-validation alongside the WOE (Logit) method reduces performance variation, enabling the development of high-accuracy and stable PTTs with transparent and use-friendly scoring systems; (3) Practical field assessments confirm that while the EMP tools are generally practical, conventional assumptions about indicator simplicity may require re-examination. Furthermore, enumerator characteristics significantly impact the practicability of the tools, suggesting their consideration in enumerator recruitment processes to optimize the tool’s practicability during implementation. This dissertation makes substantial theoretical and empirical contributions to poverty targeting research and practice through three key aspects. First, it provides compelling empirical evidence demonstrating how techniques so far have been underutilized in poverty identification; that is, the WOE technique and the k-fold cross-validation can enhance both the accuracy, transparency, and stability of poverty targeting, while highlighting the critical importance of field-based practicability assessments before implementing PPTs. Second, the research contributes an integrated methodological framework that integrates the WOE (Logit) method with the k-fold cross-validation and a mixed-methods approach of practicability assessment. This framework serves as a robust foundation for developing transparent PTTs that consistently deliver high accuracy and stable performance across diverse contexts. Third, the study not only delivers high-accuracy, stable-performance, and practical PTTs with a transparent and user-friendly scoring mechanism for ethnic minorities in Vietnam, but also offers actionable insights and strategies to maximize these tools’ practicability in real-world settings, ultimately supporting their accuracy performance during implementation. While focused on ethnic minorities in Vietnam, the broader implications of this research extend beyond this context, offering a replicable framework for constructing context-appropriate PTTs that perform accurately and reliably across diverse conditions while remaining practically feasible for frontline implementation.

Abstract (German)

Instrumente zur Identifikation und Erreichung armer Haushalte (Poverty-targeting tools, PTT) sind wichtige Instrumente, die weltweit eingesetzt werden, um anhand einfacher und überprüfbarer Indikatoren Haushalte zu ermitteln, die unter den festgelegten Armutsrichtwerten liegen, z. B. in Bezug auf den Lebensmittelkonsum oder monetäre Standards. Mit diesen Instrumenten können Sozialprogramme, die von Geldtransfers bis hin zur Unterstützung im Gesundheits- und Bildungswesen reichen, den bedürftigsten Haushalten wirksam und schnell dringende Unterstützung zukommen lassen. Trotz der erheblichen Verbesserungen, die im Laufe der Zeit erzielt wurden, weisen die aktuellen PTTs jedoch einige kritische Einschränkungen auf, die ihre Genauigkeit sowohl unter Laborbedingungen als auch im Feld beeinträchtigen. Derzeit scheinen die derzeitigen Bemühungen, die Genauigkeit der PTT durch algorithmische Verbesserungen zu erhöhen, ein Plateau zu erreichen. Die Transformationstechnik “Weight of Evidence” (WOE) hat sich als erfolgreich erwiesen, wenn es darum geht, die Vorhersagekraft von Eingangsvariablen zu optimieren und die Genauigkeit von Vorhersagemodellen in anderen Bereichen potentiell zu verbessern, aber diese Methodik ist im Bereich der Armutsbekämpfung noch nicht ausreichend erforscht. Darüber hinaus fehlen den meisten bestehenden PTTs transparente und benutzerfreundliche Bewertungssysteme. Die Technik der Bewertungsskala, die Verdopplung der Wahrscheinlichkeit, die häufig mit WOE bei der Kreditbewertung kombiniert wird, bietet eine logische und interpretierbare Beziehung zwischen Bewertungen und Ergebniswahrscheinlichkeiten, wird jedoch selten bei der Entwicklung von PTTs angewendet. Zum zweiten bleibt dieser Aspekt in der aktuellen Forschung nur unzureichend berücksichtigt, obwohl die Leistungsstabilität von PTTs von entscheidender Bedeutung ist, um ihre Zuverlässigkeit und Robustheit in verschiedenen Datensätzen und realen Anwendungen zu gewährleisten. Die meisten Studien stützen sich auf die Hold-out-Validierung (Hold-out validation), bei der die Leistung des Modells auf der Grundlage einer einzigen zufälligen Ziehung einer Aufteilung von Training und Test bewertet wird. Dieser Ansatz bietet nur einen begrenzten Einblick in die Leistungsvariabilität und hindert die Entwickler daran, zeitnahe Modellanpassungen vorzunehmen. Während die k-fache Kreuzvalidierung (K-fold cross-validation), eine im maschinellen Lernen weit verbreitete Technik, eine umfassendere Bewertung der Modellstabilität bietet und die Feinabstimmung von Vorhersagemodellen erleichtert, wird diese Technik in der Armutsforschung noch nicht ausreichend genutzt. Drittens wird die Vorhersagegenauigkeit von PTTs in der Praxis wesentlich durch ihre Praktikabilität beeinflusst, d. h. durch die Einfachheit und Überprüfbarkeit ihrer Indikatoren, aber dieser Aspekt wird oft eher angenommen als empirisch validiert. Derzeit wählen die Entwickler die Indikatoren auf der Grundlage theoretischer Annahmen über Einfachheit und Überprüfbarkeit aus, ohne diese Annahmen systematisch mit den Nutzern vor Ort zu überprüfen. Darüber hinaus können verschiedene kontextbezogene Faktoren die Praktikabilität von PTTs beeinflussen, was sich letztlich auf ihre allgemeine Vorhersagegenauigkeit in der Praxis auswirkt. Trotzdem wurde diese Dimension in keiner Studie gründlich untersucht. Um diese kritischen Lücken zu schließen, zielt diese Dissertation darauf ab, die Vorhersageleistung von PPTs sowohl in kontrollierten Forschungsumgebungen als auch in realen Implementierungssituationen zu verbessern. Das Hauptaugenmerk dieser Arbeit liegt darauf, grundlegenden Dimensionen der PTT-Effektivität voranzutreiben: technische Genauigkeit, Leistungsstabilität, Transparenz und Praktikabilität. Die Forschungsarbeit ist im Kontext ethnischer Minderheitengemeinschaften in Vietnam verortet, die die höchsten Armutsraten aufweisen und ein Hauptanliegen der nationalen Armutsbekämpfungsprogramme sind. Um dieses übergeordnete Ziel zu erreichen, verfolgt diese Dissertation die folgenden miteinander verbundenen Teilziele: (1) Untersuchung der Wirksamkeit der Anwendung der WOE-Transformationsmethode zur Verbesserung der Genauigkeit von PPTs; (2) Untersuchung der Kombination von k-facher Kreuzvalidierung mit der WOE-Technik, um eine hohe und konsistente Leistungsfähigkeit von PTTs mit transparenten und interpretierbaren Bewertungssystemen sicherzustellen; (3) Bewertung der Praktikabilität (Einfachheit und Überprüfbarkeit) der PPTs und Ermittlung der wichtigsten Faktoren, die sich auf ihre Praktikabilität unter Feldbedingungen auswirken, insbesondere im Kontext der Khmer-Gemeinschaften in Südvietnam. Diese Ziele werden in drei wissenschaftlichen Artikeln behandelt, die jeweils in den Kapiteln 2 bis 4 dieser Dissertation vorgestellt werden. Die erste Forschungskomponente dieser Dissertation wird in Kapitel 2 vorgestellt, in dem die Anpassung der WOE-Technik bei der Konstruktion von hochgenauen PTTs untersucht wird. Diese Arbeit stellt einen umfassenden Ansatz, die sogenannte WOE (Logit)-Methode, zur Entwicklung von PTTs auf der Grundlage von internationalen und nationalen Armutsgrenzen, vor. Die WOE (Logit) Methode integriert die WOE-Technik mit anderen Techniken wie logistischer Regression, dem Indikatorenauswahlansatz basierend auf c-statistischem Wert und einer Score-Skalierungstechnik der Verdopplung der Chancen. Die resultierenden PTTs werden mit bekannten Methoden wie dem Simple Poverty Scorecard, dem Proxy Means Test und dem Poverty Assessment Tool verglichen. Die Ergebnisse zeigen, dass die WOE (Logit)-Methode eine höhere Genauigkeit aufweist, insbesondere eine Verbesserung der Identifikationsraten um 1,9-5,9 Prozentpunkte für Haushalte und 1,5-3,3 Prozentpunkte für Einzelpersonen. Dieses Ergebnis ist ein wertvoller Beitrag zu einer alternativen Methodik für eine genauere Armutsbekämpfung. Kapitel 3 untersucht die Wirksamkeit der Integration der k-fachen Kreuzvalidierung in die WOE (Logit)-Methode bei der Erstellung hochpräziser und leistungsstabiler PTTs mit transparenten Bewertungsmechanismen für ethnische Minderheiten in Vietnam (EMP-Tools). In dieser Untersuchung wird eine 5-fache Kreuzvalidierung in die WOE (Logit)-Methode integriert, um die Vorhersageleistung und ihre Variation zu bewerten. Auf der Grundlage der Ergebnisse der 5-fachen Kreuzvalidierung werden zwei Strategien zur Auswahl von Indikatoren verglichen, um den besten Ansatz für die Entwicklung von PTTs mit hoher Genauigkeit und stabiler Leistung zu finden: die eine basiert auf dem höchsten c-statistischen Wert (MaxC) und die andere auf dem kleinsten Akaike-Informationskriterium (MinAIC). Die Ergebnisse zeigen, dass beide Indikatorauswahlansätze eine hohe Vorhersagekraft mit minimalen Unterschieden zwischen ihnen bieten. Der MinAIC-Ansatz zeigt jedoch eine deutlich geringere Leistungsabweichung bei kleinen städtischen Datensätzen und bleibt bei großen ländlichen Datensätzen etwas stabiler. Basierend auf diesen Erkenntnissen werden MinAIC-basierte Modelle ausgewählt, um die EMP-Tools mithilfe der Score-Scaling-Technik „Doubling-the-Odds“ zu konstruieren. Unabhängige Tests bestätigen diese Wahl: Die MinAIC-Modelle übertreffen ihre MaxC-Pendants in Bezug auf Vorhersagekraft und Standardfehler in ländlichen und städtischen Gebieten. Bei Out-of-Sample-Tests übertreffen diese Instrumente die aktuellen Modelle der vietnamesischen Regierung, wobei nur ein Drittel der Indikatoren verwendet wird. Besonders hervorzuheben ist, dass die EMP-Tools zusätzlich über einen transparenten und benutzerfreundlichen Bewertungsmechanismus verfügen, der den aktuellen Regierungsmodellen fehlt. Diese Ergebnisse unterstreichen den Wert der Einbeziehung einer k-fachen Kreuzvalidierung zur Bewertung sowohl der Genauigkeit als auch der Stabilität während der Modellauswahl. Darüber hinaus zeigt diese Studie, dass diese integrierte Strategie effektiv transparente PTTs mit hoher Genauigkeit und stabiler Leistung entwickelt. Der dritte Artikel in Kapitel 4 bewertet die Praxistauglichkeit der in Kapitel 3 entwickelten EMP-Instrumente anhand einer Feldstudie in Khmer-Gemeinden im vietnamesischen Mekong-Delta. In dieser Studie wird mit Hilfe quantitativer und qualitativer Methoden untersucht, wie die Datenerheber die Einfachheit und Überprüfbarkeit der Indikatoren wahrnehmen. Die quantitativen Daten werden mit Hilfe von Likert-Skalen, Faktorenanalyse (Factor Analysis) und Ordinary Least Squares Regression analysiert, während die qualitativen Daten mit Hilfe des thematischen Ansatzes analysiert werden. Die Ergebnisse zeigen eine komplexe Landschaft der Praktikabilität, die herkömmliche Annahmen über die Einfachheit und Überprüfbarkeit von Indikatoren in Frage stellt. Während die EMP-Instrumente im Allgemeinen als praktisch empfunden werden und mehr als die Hälfte der Datenerheber die Einfachheit und Überprüfbarkeit der meisten Indikatoren bestätigten, gibt es bei den verschiedenen Arten von Indikatoren erhebliche Unterschiede. Einige allgemein angenommene einfache Indikatoren (z. B. Handybesitz, Art des Arbeitsplatzes) werden als wenig überprüfbar eingestuft, während komplexere Indikatoren (z. B. Grundbesitz) als praktikabler angesehen werden als erwartet. Qualitative Erkenntnisse unterstreichen die entscheidende Rolle des lokalen Wissens, insbesondere von Dorfmanagern, bei der Überprüfung von Hochrisikoindikatoren. Die Merkmale der Datenerheber (wie ethnische Zugehörigkeit, Alter, Autoritätsebene des Datenerhebers und frühere Erfahrungen mit der Armutsbekämpfung) sind wichtige Faktoren für die Praktikabilität des Instruments insgesamt. Diese Ergebnisse tragen zu einem gemischten Methodenrahmen für die Vorabbewertung der PTT-Praktikabilität bei und schlagen Lösungen zur Verbesserung der Praktikabilität des Instruments durch eine gezieltere Auswahl des Datenerhebers vor. Zusammenfassend lässt sich sagen, dass die Dissertation ihre drei Teilziele erreicht hat, indem sie gezeigt hat, dass: (1) die WOE (Logit)-Methode die Vorhersagegenauigkeit von PTTs verbessert; (2) die Einbeziehung der k-fachen Kreuzvalidierung neben der WOE (Logit)-Methode reduziert Leistungsschwankungen und ermöglicht die Entwicklung hochgenauer und stabiler PTTs mit transparenten und benutzerfreundlichen Bewertungssystemen; (3) Praktische Überprüfungen im Feld bestätigen, dass die EMP-Instrumente zwar im Allgemeinen praktikabel sind, die konventionellen Annahmen über die Einfachheit der Indikatoren jedoch möglicherweise überprüft werden müssen. Darüber hinaus haben die Eigenschaften der Datenerheber einen erheblichen Einfluss auf die Anwendbarkeit der Instrumente und sollten bei der Rekrutierung von Datenerhebern berücksichtigt werden, um die Anwendbarkeit der Instrumente während der Umsetzung zu optimieren. Diese Dissertation leistet durch drei Schlüsselaspekte wesentliche theoretische und empirische Beiträge zur Armutsbekämpfungsforschung und -praxis. Erstens liefert sie überzeugende empirische Belege dafür, wie bisher zu wenig genutzte Techniken zur Armutsermittlung, nämlich die WOE-Technik und die k-fache Kreuzvalidierung, sowohl die Genauigkeit, Transparenz als auch die Stabilität der Proxyarmutsmessung verbessern können, und unterstreicht gleichzeitig die entscheidende Bedeutung von feldbasierten Praktikabilitätsbewertungen vor der Implementierung von PPTs. Zweitens trägt diese Forschungsarbeit einen integrierten methodischen Rahmen bei, der die WOE (Logit)-Methode mit der k-fachen Kreuzvalidierung und einem gemischten Methodenansatz zur Bewertung der Praktikabilität verbindet. Dieser Rahmen dient als robuste Grundlage für die Entwicklung von transparenter PTTs, die in unterschiedlichen Kontexten durchgängig hohe Genauigkeit und stabile Leistung bieten. Drittens liefert die Studie nicht nur hochpräzise, leistungsstabile und praktische PTTs mit einem transparenten und benutzerfreundlichen Bewertungsmechanismus für ethnische Minderheiten in Vietnam, sondern bietet auch umsetzbare Erkenntnisse und Strategien zur Maximierung der Praxistauglichkeit dieser Instrumente in realen Umgebungen, um letztlich ihre Genauigkeit bei der Implementierung zu unterstützen. Obwohl der Schwerpunkt auf ethnischen Minderheiten in Vietnam liegt, gehen die breiteren Implikationen dieser Forschung über diesen Kontext hinaus, indem sie einen replizierbaren Rahmen für die Konstruktion kontextangemessener PTTs bieten, die unter verschiedenen Bedingungen genau und zuverlässig funktionieren und gleichzeitig für die Frontline-Implementierung praktisch durchführbar sind.

Publication license

CC BY 4.0

Faculty

Faculty of Agricultural Sciences

Institute

Institute of Agricultural Sciences in the Tropics (Hans-Ruthenberg-Institute)

Examination date

2025-11-05

Supervisor

Zeller, Manfred

Cite this publication

Duong, B. T. (2025). Improving Accuracy, Stability, and Practicability of Poverty-Targeting Tools in the Context of Vietnamese Ethnic Minorities. https://doi.org/10.60848/13816

Identification

https://hohpublica.uni-hohenheim.de/handle/123456789/18888
https://doi.org/10.60848/13816

Language

English

Classification (DDC)

630 Agriculture

Collections

Institut für Tropische Agrarwissenschaften (Hans-Ruthenberg-Institut)

Free keywords

Poverty targeting tool Proxy means test Simple poverty scorecard Poverty assessment tool Cross validation Vietnamese poverty assessment Poverty indicator

Sustainable Development Goals

BibTeX@phdthesis{Duong2026,
url = {https://hohpublica.uni-hohenheim.de/handle/123456789/18888},
author = {Duong, Be Thanh},
title = {Improving Accuracy, Stability, and Practicability of Poverty-Targeting Tools in the Context of  Vietnamese Ethnic Minorities},
year = {2026},
}

Share this publication

Full item page

A new version of this entry is available:

Improving accuracy, stability, and practicability of poverty-targeting tools in the context of vietnamese ethnic minorities

Abstract (English)

Abstract (German)

File is subject to an embargo until

This is a correction to:

A correction to this entry is available:

This is a new version of:

Other version

Notes

Publication license

Publication series

Published in

Other version

Faculty

Institute

Examination date

Supervisor

Cite this publication

Edition / version

Citation

Identification

DOI

ISSN

ISBN

Language

Publisher

Publisher place

Classification (DDC)

Collections

Original object

University bibliography

Free keywords

Standardized keywords (GND)

Sustainable Development Goals

BibTeX

Share this publication