From Linear Models to Machine Learning

Author: Norman Matloff

Publisher: CRC Press

ISBN: 1351645897

Category: Business & Economics

Page: 490

View: 8808

Statistical Regression and Classification: From Linear Models to Machine Learning takes an innovative look at the traditional statistical regression course, presenting a contemporary treatment in line with today's applications and users. The text takes a modern look at regression: * A thorough treatment of classical linear and generalized linear models, supplemented with introductory material on machine learning methods. * Since classification is the focus of many contemporary applications, the book covers this topic in detail, especially the multiclass case. * In view of the voluminous nature of many modern datasets, there is a chapter on Big Data. * Has special Mathematical and Computational Complements sections at ends of chapters, and exercises are partitioned into Data, Math and Complements problems. * Instructors can tailor coverage for specific audiences such as majors in Statistics, Computer Science, or Economics. * More than 75 examples using real data. The book treats classical regression methods in an innovative, contemporary manner. Though some statistical learning methods are introduced, the primary methodology used is linear and generalized linear parametric models, covering both the Description and Prediction goals of regression methods. The author is just as interested in Description applications of regression, such as measuring the gender wage gap in Silicon Valley, as in forecasting tomorrow's demand for bike rentals. An entire chapter is devoted to measuring such effects, including discussion of Simpson's Paradox, multiple inference, and causation issues. Similarly, there is an entire chapter of parametric model fit, making use of both residual analysis and assessment via nonparametric analysis. Norman Matloff is a professor of computer science at the University of California, Davis, and was a founder of the Statistics Department at that institution. His current research focus is on recommender systems, and applications of regression methods to small area estimation and bias reduction in observational studies. He is on the editorial boards of the Journal of Statistical Computation and the R Journal. An award-winning teacher, he is the author of The Art of R Programming and Parallel Computation in Data Science: With Examples in R, C++ and CUDA.
Read More

Author: Taylor Arnold,Michael Kane,Bryan W. Lewis

Publisher: CRC Press

ISBN: 1351694766

Category: Business & Economics

Page: 362

View: 7918

A Computational Approach to Statistical Learning gives a novel introduction to predictive modeling by focusing on the algorithmic and numeric motivations behind popular statistical methods. The text contains annotated code to over 80 original reference functions. These functions provide minimal working implementations of common statistical learning algorithms. Every chapter concludes with a fully worked out application that illustrates predictive modeling tasks using a real-world dataset. The text begins with a detailed analysis of linear models and ordinary least squares. Subsequent chapters explore extensions such as ridge regression, generalized linear models, and additive models. The second half focuses on the use of general-purpose algorithms for convex optimization and their application to tasks in statistical learning. Models covered include the elastic net, dense neural networks, convolutional neural networks (CNNs), and spectral clustering. A unifying theme throughout the text is the use of optimization theory in the description of predictive models, with a particular focus on the singular value decomposition (SVD). Through this theme, the computational approach motivates and clarifies the relationships between various predictive models. Taylor Arnold is an assistant professor of statistics at the University of Richmond. His work at the intersection of computer vision, natural language processing, and digital humanities has been supported by multiple grants from the National Endowment for the Humanities (NEH) and the American Council of Learned Societies (ACLS). His first book, Humanities Data in R, was published in 2015. Michael Kane is an assistant professor of biostatistics at Yale University. He is the recipient of grants from the National Institutes of Health (NIH), DARPA, and the Bill and Melinda Gates Foundation. His R package bigmemory won the Chamber's prize for statistical software in 2010. Bryan Lewis is an applied mathematician and author of many popular R packages, including irlba, doRedis, and threejs.
Read More

Author: Andrew Metcalfe,Tony Greenfield

Publisher: CRC Press

ISBN: 1439895481

Category: Mathematics

Page: 700

View: 3236

This is a textbook for an undergraduate course in statistics for engineers with a minimal calculus prerequisite. The second edition differs from existing books in three main aspects: it is the only introductory statistics textbook written for engineers that uses R throughout the text, there is an emphasis on statistical methods most relevant to engineers that are illustrated with practical applications, and there is an emphasis on random number generation and simulation, all very useful features in engineering.
Read More

Author: Kevin J. Keen

Publisher: CRC Press

ISBN: 0429632215

Category: Mathematics

Page: 590

View: 8653

Praise for the First Edition "The main strength of this book is that it provides a unified framework of graphical tools for data analysis, especially for univariate and low-dimensional multivariate data. In addition, it is clearly written in plain language and the inclusion of R code is particularly useful to assist readers’ understanding of the graphical techniques discussed in the book. ... It not only summarises graphical techniques, but it also serves as a practical reference for researchers and graduate students with an interest in data display." -Han Lin Shang,?Journal of Applied Statistics Graphics for Statistics and Data Analysis with R, Second Edition, presents the basic principles of graphical design and applies these principles to engaging examples using the graphics and lattice packages in R. It offers a wide array of modern graphical displays for data visualization and representation. Added in the second edition are coverage of the ggplot2 graphics package, material on human visualization and color rendering in R, on screen, and in print. Features Emphasizes the fundamentals of statistical graphics and best practice guidelines for producing and choosing among graphical displays in R Presents technical details on topics such as: the estimation of quantiles, nonparametric and parametric density estimation; diagnostic plots for the simple linear regression model; polynomial regression, splines, and locally weighted polynomial regression for producing a smooth curve; Trellis graphics for multivariate data Provides downloadable R code and data for figures at www.graphicsforstatistics.com Kevin J. Keen is a Professor of Mathematics and Statistics at the University of Northern British Columbia (Prince George, Canada) and an Accredited Professional StatisticianTM by the Statistical Society of Canada and the American Statistical Association.
Read More

Linear and Nonlinear Modeling

Author: Sadanori Konishi

Publisher: CRC Press

ISBN: 1466567287

Category: Mathematics

Page: 338

View: 5111

Select the Optimal Model for Interpreting Multivariate Data Introduction to Multivariate Analysis: Linear and Nonlinear Modeling shows how multivariate analysis is widely used for extracting useful information and patterns from multivariate data and for understanding the structure of random phenomena. Along with the basic concepts of various procedures in traditional multivariate analysis, the book covers nonlinear techniques for clarifying phenomena behind observed multivariate data. It primarily focuses on regression modeling, classification and discrimination, dimension reduction, and clustering. The text thoroughly explains the concepts and derivations of the AIC, BIC, and related criteria and includes a wide range of practical examples of model selection and evaluation criteria. To estimate and evaluate models with a large number of predictor variables, the author presents regularization methods, including the L1 norm regularization that gives simultaneous model estimation and variable selection. For advanced undergraduate and graduate students in statistical science, this text provides a systematic description of both traditional and newer techniques in multivariate analysis and machine learning. It also introduces linear and nonlinear statistical modeling for researchers and practitioners in industrial and systems engineering, information science, life science, and other areas.
Read More

A Guide to Data Science

Author: Thomas W. Miller

Publisher: FT Press

ISBN: 013389214X

Category: Computers

Page: 448

View: 2733

Master predictive analytics, from start to finish Start with strategy and management Master methods and build models Transform your models into highly-effective code—in both Python and R This one-of-a-kind book will help you use predictive analytics, Python, and R to solve real business problems and drive real competitive advantage. You’ll master predictive analytics through realistic case studies, intuitive data visualizations, and up-to-date code for both Python and R—not complex math. Step by step, you’ll walk through defining problems, identifying data, crafting and optimizing models, writing effective Python and R code, interpreting results, and more. Each chapter focuses on one of today’s key applications for predictive analytics, delivering skills and knowledge to put models to work—and maximize their value. Thomas W. Miller, leader of Northwestern University’s pioneering program in predictive analytics, addresses everything you need to succeed: strategy and management, methods and models, and technology and code. If you’re new to predictive analytics, you’ll gain a strong foundation for achieving accurate, actionable results. If you’re already working in the field, you’ll master powerful new skills. If you’re familiar with either Python or R, you’ll discover how these languages complement each other, enabling you to do even more. All data sets, extensive Python and R code, and additional examples available for download at http://www.ftpress.com/miller/ Python and R offer immense power in predictive analytics, data science, and big data. This book will help you leverage that power to solve real business problems, and drive real competitive advantage. Thomas W. Miller’s unique balanced approach combines business context and quantitative tools, illuminating each technique with carefully explained code for the latest versions of Python and R. If you’re new to predictive analytics, Miller gives you a strong foundation for achieving accurate, actionable results. If you’re already a modeler, programmer, or manager, you’ll learn crucial skills you don’t already have. Using Python and R, Miller addresses multiple business challenges, including segmentation, brand positioning, product choice modeling, pricing research, finance, sports, text analytics, sentiment analysis, and social network analysis. He illuminates the use of cross-sectional data, time series, spatial, and spatio-temporal data. You’ll learn why each problem matters, what data are relevant, and how to explore the data you’ve identified. Miller guides you through conceptually modeling each data set with words and figures; and then modeling it again with realistic code that delivers actionable insights. You’ll walk through model construction, explanatory variable subset selection, and validation, mastering best practices for improving out-of-sample predictive performance. Miller employs data visualization and statistical graphics to help you explore data, present models, and evaluate performance. Appendices include five complete case studies, and a detailed primer on modern data science methods. Use Python and R to gain powerful, actionable, profitable insights about: Advertising and promotion Consumer preference and choice Market baskets and related purchases Economic forecasting Operations management Unstructured text and language Customer sentiment Brand and price Sports team performance And much more
Read More

Author: Allen B. Downey

Publisher: O'Reilly Germany

ISBN: 3868993436

Category: Computers

Page: 160

View: 428

Wenn Sie programmieren können, beherrschen Sie bereits Techniken, um aus Daten Wissen zu extrahieren. Diese kompakte Einführung in die Statistik zeigt Ihnen, wie Sie rechnergestützt, anstatt auf mathematischem Weg Datenanalysen mit Python durchführen können. Praktischer Programmier-Workshop statt grauer Theorie: Das Buch führt Sie anhand eines durchgängigen Fallbeispiels durch eine vollständige Datenanalyse -- von der Datensammlung über die Berechnung statistischer Kennwerte und Identifikation von Mustern bis hin zum Testen statistischer Hypothesen. Gleichzeitig werden Sie mit statistischen Verteilungen, den Regeln der Wahrscheinlichkeitsrechnung, Visualisierungsmöglichkeiten und vielen anderen Arbeitstechniken und Konzepten vertraut gemacht. Statistik-Konzepte zum Ausprobieren: Entwickeln Sie über das Schreiben und Testen von Code ein Verständnis für die Grundlagen von Wahrscheinlichkeitsrechnung und Statistik: Überprüfen Sie das Verhalten statistischer Merkmale durch Zufallsexperimente, zum Beispiel indem Sie Stichproben aus unterschiedlichen Verteilungen ziehen. Nutzen Sie Simulationen, um Konzepte zu verstehen, die auf mathematischem Weg nur schwer zugänglich sind. Lernen Sie etwas über Themen, die in Einführungen üblicherweise nicht vermittelt werden, beispielsweise über die Bayessche Schätzung. Nutzen Sie Python zur Bereinigung und Aufbereitung von Rohdaten aus nahezu beliebigen Quellen. Beantworten Sie mit den Mitteln der Inferenzstatistik Fragestellungen zu realen Daten.
Read More

Author: Joseph Adler

Publisher: O'Reilly Germany

ISBN: 3897216507

Category: Computers

Page: 768

View: 5094

Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.
Read More

Modellierung und Anwendung technischer Rauschprozesse

Author: Stefan Schäffler

Publisher: Springer-Verlag

ISBN: 366254265X

Category: Mathematics

Page: 183

View: 3165

Dieses Lehrbuch behandelt die in Natur- und Ingenieurwissenschaften eine zentrale Rolle spielenden Rauschprozesse, wie weißes Rauschen in der Raumsondenkommunikation oder thermisches Rauschen und Schrotrauschen in elektronischen Bauelementen.In dieser Form einzigartig, entwickelt der Autor die mathematische Theorie der verallgemeinerten stochastischen Prozesse und spricht dabei die Anwendung dieser mathematischen Objekte in der Praxis (z.B. Schaltkreissimulation, digitale Nachrichtenübertragung und Bildverarbeitung) an; somit dient dieses Lehrbuch auch als praxisrelevante Einführung in die Modellierung und Verwendung technischer Rauschprozesse. Die mathematische Modellierung von Rauschprozessen führt auf die Theorie stochastischer Prozesse auf Basis verallgemeinerter Funktionen (Distributionen), ohne die kein Handy funktionieren und Anwendungen wie die Simulation komplexer elektronischer Schaltungen unmöglich wäre.Für Anwender und interessierte Mathematiker bietet dieses Werk erstmals einen mathematisch fundierten Einblick in diese Thematik.
Read More

Author: Andrew C. Harvey

Publisher: Walter de Gruyter GmbH & Co KG

ISBN: 3486786741

Category: Business & Economics

Page: 396

View: 4619

Gegenstand des Werkes sind Analyse und Modellierung von Zeitreihen. Es wendet sich an Studierende und Praktiker aller Disziplinen, in denen Zeitreihenbeobachtungen wichtig sind.
Read More

Design of Experiments (DoE)

Author: Karl Siebertz,David van Bebber,Thomas Hochkirchen

Publisher: Springer-Verlag

ISBN: 3642054935

Category: Mathematics

Page: 328

View: 2160

Die statistische Versuchsplanung (Design of Experiment, DoE) ist ein Verfahren zur Analyse von (technischen) Systemen. Dieses Verfahren ist universell einsetzbar und eignet sich sowohl zur Produkt- als auch zur Prozessoptimierung, insbesondere dann, wenn viele Einflussgrößen zu berücksichtigen sind. Hauptanliegen der Autoren ist es, die Planung und Durchführung von systematischen Versuchsreihen mit engem Praxisbezug darzustellen. Industriespezifische Probleme illustrieren sie anhand zahlreicher Fallbeispiele.
Read More

Modelle, Methoden und Anwendungen

Author: Ludwig Fahrmeir,Thomas Kneib,Stefan Lang

Publisher: Springer-Verlag

ISBN: 3642018378

Category: Business & Economics

Page: 502

View: 5000

In dem Band beschreiben die Autoren erstmals klassische Regressionsansätze und moderne nicht- und semiparametrische Methoden in einer integrierten und anwendungsorientierten Form. Um Lesern die Analyse eigener Fragestellungen zu ermöglichen, demonstrieren sie die praktische Anwendung der Konzepte und Methoden anhand ausführlicher Fallstudien. Geeignet für Studierende der Statistik sowie für Wissenschaftler und Praktiker, zum Beispiel in den Wirtschafts- und Sozialwissenschaften, der Bioinformatik und -statistik, Ökonometrie und Epidemiologie.
Read More

Author: Shin Takahashi

Publisher: Springer-Verlag

ISBN: 9783834805669

Category: Mathematics

Page: 189

View: 2578

Statistik ist trocken und macht keinen Spaß? Falsch! Mit diesem Manga lernt man die Grundlagen der Statistik kennen, kann sie in zahlreichen Aufgaben anwenden und anhand der Lösungen seinen Lernfortschritt überprüfen – und hat auch noch eine Menge Spaß dabei! Eigentlich will die Schülerin Rui nur einen Arbeitskollegen ihres Vaters beeindrucken und nimmt daher Nachhilfe in Statistik. Doch schnell bemerkt auch sie, wie interessant Statistik sein kann, wenn man beispielsweise Statistiken über Nudelsuppen erstellt. Nur ihren Lehrer hatte sich Rui etwas anders vorgestellt, er scheint ein langweiliger Streber zu sein – oder?
Read More

praktische Werkzeuge und Techniken für das maschinelle Lernen

Author: Ian H. Witten,Eibe Frank

Publisher: N.A

ISBN: 9783446215337

Category:

Page: 386

View: 9310

Read More

Author: Andrie de Vries,Joris Meys

Publisher: John Wiley & Sons

ISBN: 3527812520

Category: Computers

Page: 414

View: 8559

Wollen Sie auch die umfangreichen Möglichkeiten von R nutzen, um Ihre Daten zu analysieren, sind sich aber nicht sicher, ob Sie mit der Programmiersprache wirklich zurechtkommen? Keine Sorge - dieses Buch zeigt Ihnen, wie es geht - selbst wenn Sie keine Vorkenntnisse in der Programmierung oder Statistik haben. Andrie de Vries und Joris Meys zeigen Ihnen Schritt für Schritt und anhand zahlreicher Beispiele, was Sie alles mit R machen können und vor allem wie Sie es machen können. Von den Grundlagen und den ersten Skripten bis hin zu komplexen statistischen Analysen und der Erstellung aussagekräftiger Grafiken. Auch fortgeschrittenere Nutzer finden in diesem Buch viele Tipps und Tricks, die Ihnen die Datenauswertung erleichtern.
Read More

Modulare Wissensbasen für elektronische Lernumgebungen

Author: Cornelia Seeberg

Publisher: Springer-Verlag

ISBN: 3642558216

Category: Computers

Page: 223

View: 8821

Lernen mit elektronischen Dokumenten wird immer wichtiger. Der entscheidende Vorteil des Mediums Computer ist die Möglichkeit, dynamische Dokumente zu erzeugen. Diese Dynamik kann zum einen in den einzelnen Inhalten liegen (Animationen, Simulationen) oder in der Erstellung der Dokumente (adaptive Anpassung an die einzelnen Benutzer/innen). Die Lerndokumente liegen dafür in Modulen, nicht als ein großes Dokument vor. Um diese Vorteile nutzen zu können, müssen die Module beschrieben sein. Das Buch bietet ein Beschreibungsschema, mit dem aus einer Wissensbasis von unzusammenhängenden Modulen ein gut lesbares und auf die Bedürfnisse der einzelnen Leser/innen angepasstes webbasiertes Dokument erstellt werden kann.
Read More