statystyka - jagiellonian university · temporal processes that are locally time-harmonizable. our...

54
statystyka patron sesji: Jerzy Splawa-Neyman Jubileuszowy Zjazd Matematyków Polskich w stulecie Polskiego Towarzystwa Matematycznego Kraków 3 -7 września 2019

Upload: others

Post on 11-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

statystyka

patron sesji: Jerzy Spława-Neyman

Jubileuszowy Zjazd Matematyków Polskich

w stuleciePolskiego Towarzystwa MatematycznegoKraków 3 -7 września 2019

Page 2: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

Spis treści

Statystyka 6

7 Damian BrzyskiThe cooperation of nuclear and `1 norms in revealingthe association between HIV disease and brain con-nectivity structure

9 Tomasz BurzykowskiEstimation of treatment effects in cancer clinical trialswhen the proportional hazard assumption is not ful-filled

10 Bogdan Ćmiel, Tadeusz Inglot, TeresaLedwinaEfektywność pośrednia w nieparametrycznych pro-blemach testowania

Page 3: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

11 Anna Dudek(dual-frequency)-dependent dynamic functional con-nectivity analysis of visual working memory capacity

13 Alain DurmusAnalysis of Langevin Monte-Carlo via convex opti-mization

14 Katarzyna FilipiakTesting covariance structure and estimation of unk-nown parameters under doubly multivariate models

16 Konrad FurmańczykSzacowanie błędu klasyfikacji w źle wyspecyfiko-wanym modelu regresji binarnej

17 Lesław GajekNieparametryczna estymacja prawdopodobieństw ru-iny w modelach przełącznikowych

19 Piotr Graczyk, H. Ishi, B. Kołodziejek, H.MassamModel selection in the space of coloured Gaussianmodels

21 Jaroslaw HarezlakBrain Connectivity-Informed Adaptive Regularizationfor Generalized Outcomes

Page 4: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

SPIS TREŚCI 4

22 Marek Kimmel, Philip Ernst, Monika Kur-pas, Quan ZhouHeavy-Tailed Distributions in Models of SecondaryTumors

24 John KornakBayesian image analysis in transformed spaces

26 Andrzej KozekOdporna estymacja ’szkieletu’ rozkładu wielowymia-rowego

28 Mariusz Kubkowski, Jan MielniczukTwo-step selection method for misspecified binaryregression

30 Rafał KulikLimit theorems for empirical cluster functionals withapplications to statistical inference

31 Błażej MiasojedowNon-asymptotic Analysis of Biased Stochastic Ap-proximation Schemes

32 Wojciech Niemiro, Tomasz Cąkała, Bła-żej MiasojedowPoisson Tree MCMC

Page 5: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

SPIS TREŚCI 5

34 Hernando OmbaoStatistical Real-Time Tools for Exploring Depen-dence in Multivariate Time Series

36 Mirosław PawlakMetody najbliższego sąsiada w modelowaniu pre-dykcyjnym

38 Krzysztof Podgórski, Tomasz J. Kozu-bowskiA novel weighted likelihood estimation with empiri-cal Bayes flavor

40 Łukasz RajkowskiGeometria rozbicia MAP w bayesowskich modelachmieszanek

42 Timothy RandolphA regression framework for multi-view analysis ofhigh-dimensional structured data

43 Wojciech Rejchel, Małgorzatą BogdanSzybka i odporna selekcja cech w modelach regre-syjnych

45 Krzysztof RudaśWłasności estymatorów w modelowaniu przyczyno-wości

Page 6: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

47 Tomasz RychlikZmienność średnich i kwantyli mieszanek uporząd-kowanych rozkładów przy niedokładnym wyborzerozkładu a priori

48 Zbigniew SzkutnikZasada Morozowa dla poissonowskich problemówodwrotnych

49 Paweł TeisseyreClassifier chains for multi-label classification

51 Jacek WesołowskiAsymptotics of the overflow in urn models

53 Grzegorz WyłupekAdaptacyjny jednostronny dwupróbkowy test Kaplana-Meiera

Page 7: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 7

The cooperation of nuclear and `1 norms in reve-aling the association between HIV disease andbrain connectivity structureDamian [email protected] Wrocławska

Classical regression methods treat covariates as a vec-tor and estimate a corresponding vector of regression coeffi-cients. In medical applications, however, regressors in a formof multidimensional arrays can be often met. For example,one may be interested in identifying regions of the brain as-sociated with an outcome of interest based on MRI images.Turning such image array into a vector is an unsatisfactorysolution, since it destroys the inherent spatial structure of theimage and could be very challenging from the computationalpoint of view. In my talk, I will present an alternative ap-proach, where the whole matrix of regression coefficients isestimated. The method we propose, called Sparsity InducingNuclear Norm Estimator (SpINNEr), simultaneously impo-ses two types of penalties on the matrix – the nuclear and`1 norms – to encourage the low rank of the solution and itsentry-wise sparsity. Our software allows for the automatic se-lection of the weights defining the optimal trade-off betweentwo considered types of penalties. SPINNER has been ap-plied to investigate associations between brain’s structuralconnections and HIV disease-related outcomes.

References

Page 8: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 8

[1] H. Zhou, Lexin Li Regularized matrix regression, JRSS-B, 76(2), 2013.

Powrót do indeksu abstraktów sekcji

Page 9: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 9

Estimation of treatment effects in cancer clinicaltrials when the proportional hazard assumptionis not fulfilledTomasz [email protected] University, Belgia

Currently, treatment effects in cancer clinical trials withtime-to-event endpoints are estimated almost exclusively byusing the proportional-hazard (PH) model. The PH assump-tion is, however, very restrictive and is almost surely notfulfilled in the case of, for instance, modern immunotherapies.Thus, there is a need to develop and use other methods ofthe estimation of treatment effects. In the presentation seve-ral such methods will be reviewed, including the acceleratedfailure-time model, the restricted mean survival time, and thecure-fraction model.

Powrót do indeksu abstraktów sekcji

Page 10: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 10

Efektywność pośrednia w nieparametrycznychproblemach testowaniaBogdan Ć[email protected] Górnicz-Hutnicza

Zdefiniujemy efektywność pośrednią, omówimy jej wła-sności oraz przedyskutujemy jej praktyczną interpretację. Po-każemy, że efektywność pośrednia jest dobrym narzędziemdo teoretycznego porównywania testów nieparametrycznych.Przedstawimy twierdzenia o efektywności pośredniej oraz sy-mulacje numeryczne potwierdzające użyteczność tych twier-dzeń na przykładach problemów testowania stochastycznegouporządkowania oraz testowania zgodności. Twierdzenia teoraz symulacje będą dotyczyły testów typu Kołmogorowa-Smirnowa i Andersona-Darlinga. Przedstawiony referat bę-dzie streszczeniem wyników z pracy Inglot et al. (2019) iĆmiel et al. (2019).

Bibliografia[1] T. Inglot, T. Ledwina, B. Ćmiel, Intermediate efficiency

in nonparametric testing problems with an applicationto some weighted statistics, ESAIM: Probability andStatistics,https://doi.org/10.1051/ps/2018022 (2019)

[2] B. Ćmiel, T. Inglot, T. Ledwina, Intermediate effciencyof some weighted goodness-of-fit statistics,http://arxiv.org/abs/1906.09143 (2019)

Powrót do indeksu abstraktów sekcji

Page 11: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 11

(dual-frequency)-dependent dynamic functionalconnectivity analysis of visual working memorycapacityAnna [email protected] Górniczo-Hutnicza

We develop a novel methodology for studying the dyna-mic functional connectivity within the brain from EEG traces.Our observations consist of replicated realizations of spatio-temporal processes that are locally time-harmonizable. Ourbootstrap-based methodology estimates confidence intervalsfor both the spatial time-varying Loève-spectrum and thespatial time-varying dual-frequency coherence functions un-der realistic modeling assumptions. We illustrate the appli-cation of this methodology on a data set arising from anexperiment designed to assess the capacity of the visual wor-king memory. Our real data analysis pipeline starts with theclustering of our replicated time series obtained from toro-idal mixture modeling of the corresponding response varia-bles which describe the quality of memorization. Then weestimate the spatial time-varying dual-frequency coherencefunctions and the corresponding connectivity matrices withineach cluster. This procedure allows us to potentially iden-tify specific patterns in the dynamic functional connectivitycharacterizing each cluster. More specifically we reveal thatbetter visual working memory performance is apparently as-sociated to longer connectivity period within the prefrontalcortex between the alpha-beta frequency bands during the

Page 12: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 12

memorization task.Joint work with J. Aston, D. Dehay, J-M. Freyermuth, D.

Scucs, L. Colling

References[1] J. Aston, D. Dehay, A.E. Dudek, J-M. Freyermuth, D.

Scucs, L. Colling, (dual-frequency)-dependent dynamicfunctional connectivity analysis of visual working me-mory capacity, submitted.

Powrót do indeksu abstraktów sekcji

Page 13: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 13

Analysis of Langevin Monte-Carlo via convexoptimizationAlain [email protected] Paris-Saclay

We provide new insights on the Unadjusted Langevin Al-gorithm. We show that this method can be formulated asa first order optimization algorithm of an objective functionaldefined on the Wasserstein space of order 2. Using this inter-pretation and techniques borrowed from convex optimization,we give a non-asymptotic analysis of this method to samplefrom log concave smooth target distribution. Our proofs arethen easily extended to the Stochastic Gradient LangevinDynamics, which is a popular extension of the UnadjustedLangevin Algorithm. Finally, this interpretation leads to anew methodology to sample from a non-smooth target distri-bution, for which a similar study is done. This is a joint workwith Szymon Majewski and Błażej Miasojedow. Powrótdo indeksu abstraktów sekcji

Page 14: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 14

Testing covariance structure and estimation ofunknown parameters under doubly multivariatemodelsKatarzyna [email protected] Poznańska

The covariance matrix of doubly multivariate data hasoften a separable structure, that is it can be presented as aKronecker product of two positive definite matrices. In par-ticular, one of the separability components can be furtherspecified, as e.g. compound symmetry or autoregression oforder one. In this talk two methods of covariance structurefitting will be presented, as well as two testing proceduresbased on the likelihood ratio and Rao score test will be deve-loped. Using simulation studies it will be shown that the Raoscore test outperforms the likelihood ratio test in the numberof contexts. Finally, the estimators of unknown parametersunder the tri-linear multivariate model will be given.

All the results will be illustrated by real data examples.

References[1] K. Filipiak and D. Klein, Approximation with a Kronec-

ker product structure with one component as compoundsymmetry or autoregression, Linear Algebra Appl. 559:11–33 (2018).

[2] K. Filipiak and D. Klein, Estimation of parameters un-der a generalized growth curve model, J. MultivariateAnal. 158: 73–86 (2017).

Page 15: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 15

[3] K. Filipiak, D. Klein, and A. Roy, A comparison of li-kelihood ratio tests and Rao’s score test for three se-parable covariance matrix structures, Biometrical J. 59:192–215 (2017).

[4] K. Filipiak, D. Klein, and A. Roy, Score test for a sepa-rable covariance structure with the first component ascompound symmetric correlation matrix, J. MultivariateAnal. 150: 105-124 (2016).

Powrót do indeksu abstraktów sekcji

Page 16: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 16

Szacowanie błędu klasyfikacji w źle wyspecyfi-kowanym modelu regresji binarnejKonrad Furmań[email protected]ł Zastosowań Informatyki i Matematyki SGGW

W referacie zostanie przedstawione oszacowanie ekscesuryzyka dla błędu klasyfikacji w źle wyspecyfikowanym mo-delu regresji binarnej. Podamy wyniki dla klasyfikacji opar-tej o regresje logistyczną oraz klasyfikacje liniową. Uzyskanewyniki są oparte na pracach [1]-[3].

Bibliografia[1] M. Kubkowski, Misspecification of binary regression

model: properties and inferential procedures. Ph.D. The-sis, Warsaw University of Technology, Warsaw, 2019.

[2] M. Kubkowski and J. Mielniczuk, Selection consistencyof two-step selection method for misspecified logisticmodel, Submitted

[3] T. Zhang, Statistical behavior and consistency of clas-sification methods based on convex risk minimization,Ann. Stat. 32: 56–134 (2004).

Powrót do indeksu abstraktów sekcji

Page 17: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 17

Nieparametryczna estymacja prawdopodo-bieństw ruiny w modelach przełącznikowychLesław [email protected] Łódzka

Modele przełącznikowe uogólniają wiele znanych modeliryzyka w ubezpieczeniach (zobacz na przykład Lu (2006)).Wykorzystują one łańcuch Markowa, który zmienia rozkładwielkości szkody lub/i czasu oczekiwania na nią, natomiastubezpieczyciel może dostosować swoją strategię zmieniającwysokość składki. W pracy Gajek, L. , Rudź, M. (2018) poka-zano, że wektor prawdopodobieństw ruiny w nieskończonymhoryzoncie czasu, Ψ, jest punktem stałym wektorowego ope-ratora ryzyka w tym modelu. Operator ryzyka jest kontrakcjąw odpowiedniej przestrzeni metrycznej, co ma istotne zna-czenie dla naszej metody estymacji. Konstruując odpowiedniempiryczny operator ryzyka, definiujemy jego punkt stały Ψnjako estymator wektora Ψ. Pokażemy, że estymator Ψn jestzbieżny do Ψ w odpowiedniej ważonej metryce średniokwa-dratowej.

Bibliografia[1] Y. Lu, On the severity of ruin in a Markov-modulated

risk model, Scandinavian Actuarial Journal, 4: 183–202(2006).

[2] L. Gajek and M. Rudź, Banach Contraction Principleand ruin probabilities in regime switching-models, In-surance: Mathematics and Economics, 80: 45–53 (2018).

Page 18: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 18

Powrót do indeksu abstraktów sekcji

Page 19: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 19

Model selection in the space of coloured Gaus-sian modelsPiotr [email protected] Université d’Angers, Francja

In order to make Graphical Gaussian Models a viablemodeling tool in the modern Big Data Science, i.e. when thenumber of variables outgrows the number of observations,Højsgaard and Lauritzen introduced in 2008 model classeswhich set equality restrictions on certain entries of cova-riance matrix or precision matrix. Such models can be repre-sented by coloured graphs.The estimation theory for Coloured Graphical Models is wellestablished, whereas the Model Selection within the Colo-ured Graphical Models class is still not satisfactory. We con-sider multivariate Gaussian models for the random variableX = (X1, . . . , Xp), invariant under the action of a subgroupof the group of permutations on {1, . . . , p}. Using the repre-sentations of the symmetric group on the field of reals, wederive the analytic expression of the normalizing constantof the Diaconis-Ylvisaker conjugate prior for the precisionparameter K = Σ−1. We can thus perform Bayesian modelselection in the class of complete Gaussian models invariant(coloured) by the action of a subgroup of the symmetric group,which we could also call complete RCOP models. We illu-strate our results with Frets’ Heads example of dimension 4,several simulated examples of dimension p < 9 and a high-dimensional example with p = 100 in the case of a cyclic

Page 20: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 20

group generated by one permutation.This is a joint work with H. Ishi(Nagoya), B. Kołodzie-

jek(Pol. Warszawska) and H. Massam(Toronto).

References[1] Hojsgaard, S.; Lauritzen, S. L. Graphical Gaussian mo-

dels with edge and vertex symmetries. J. R. Stat. Soc.Ser. B, 70:1005-1027, 2008.

[2] Maathuis, M.,Drton, M., Lauritzen, S. and Wainwright,M. Editors , Handbook of Graphical Models, Chapmanand Hall - CRC Handbooks of Modern Statistical Me-thods, Chapman and Hall - CRC, 2018, 536 p.

Powrót do indeksu abstraktów sekcji

Page 21: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 21

Brain Connectivity-Informed Adaptive Regulari-zation for Generalized OutcomesJaroslaw [email protected] University, USA

A challenging problem in the brain imaging research isa principled incorporation of information from different ima-ging modalities in regression models. Frequently, data fromeach modality is analyzed separately using, for instance, di-mensionality reduction techniques, which result in a loss ofinformation. We propose a novel regularization method, gri-PEER (generalized ridgified Partially Empirical Eigenvec-tors for Regression) to estimate the association between thebrain structure features and a scalar outcome within thegeneralized linear regression framework. griPEER providesa principled approach to use external information from thestructural brain connectivity to improve the regression coef-ficient estimation. Our proposal incorporates a penalty term,derived from the structural connectivity Laplacian matrix, inthe penalized generalized linear regression. We address boththeoretical and computational issues and show that our me-thod is robust to the incomplete structural brain connectivityinformation. griPEER is evaluated via extensive simulationstudies and it is applied in classification of the HIV+ andHIV- individuals.

Powrót do indeksu abstraktów sekcji

Page 22: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 22

Heavy-Tailed Distributions in Models of Secon-dary TumorsMarek [email protected] University, USA

Recent progress in microdissection and in DNA sequen-cing has facilitated the subsampling of multi-focal cancers inorgans such as the liver in several hundred spots, helpingto determine the pattern of mutations in each of these spots.These studies have led to diverse conclusions concerning theDarwinian (selective) or neutral evolution in cancer. Mathe-matical models of the development of multi-focal tumors havebeen devised to support these claims. We offer a model forthe development of a multifocal tumor: it is a mathematicallyrigorous refinement of a model of Ling et al. (2015). Gu-ided by numerical studies and simulations, we show that therigorous model, in the form of an infinite-type branching pro-cess, displays distributions of tumor size which have heavytails and moments that become infinite in finite time. To de-monstrate these points, we obtain bounds on the tails of thedistributions of the process and an infinite series expansionfor the first moments. In addition to its inherent mathemati-cal interest, the model is corroborated by recent literature onapparent super-exponential growth in cancer metastases.

Joint work with Philip Ernst, Monika Kurpas and QuanZhou

References

Page 23: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 23

[1] P. Ernst, M. Kimmel, M. Kurpas and Q. Zhou, Heavy-tailed distributions in branching process models of se-condary cancerous tumors, Adv. Appl. Prob. 50A 99 –114 (2018).

Powrót do indeksu abstraktów sekcji

Page 24: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 24

Bayesian image analysis in transformed spacesJohn [email protected] of California, USA

Bayesian image analysis can improve image quality, bybalancing a priori expectations of image characteristics, witha model for the noise process via Bayes Theorem. We willgive a reformulation of the conventional Bayesian image ana-lysis paradigm in Fourier and wavelet spaces, e.g. for Fourierspace the prior and likelihood are given in terms of spa-tial frequency signals. By specifying the Bayesian model intransformed spaces, spatially correlated priors, that are rela-tively difficult to model and compute in conventional imagespace, can be efficiently modeled as a set of independentprocesses across; the priors are modeled as independent overthe transformed space, but tied together by defining a para-meter function over the space for the values of the pdf para-meters. The originally inter-correlated and high-dimensionalproblem in image space is thereby broken down into a se-ries of (trivially parallelizable) independent one-dimensionalproblems. We will describe the Bayesian image analysis intransformed space modeling approach, illustrate its compu-tational efficiency and speed, and demonstrate useful pro-perties such as isotropy and resolution invariance to modelspecification which are difficult to obtain in the conventionalformulation. We will describe applications in medical ima-ging, and contrast with results using conventional Bayesianimage analysis models. Finally, we will showcase a Python

Page 25: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 25

package that is under development to make the approachwidely accessible.

Powrót do indeksu abstraktów sekcji

Page 26: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 26

Odporna estymacja ’szkieletu’ rozkładu wielo-wymiarowegoAndrzej [email protected] University, Australia

Rozważany jest problem estymacji ’szkieletu’ wielowy-miarowego rozkładu P w Rk rozumianego jako zbiór Sn zło-żony z n punktów w Rk dobranych tak, by dyskretny rozkładjednostajny na Sn możliwie jak najlepiej przybliżał orygi-nalny i nieznany rozkład P . Estymacja jest oparta na Nniezależnych obserwacjach X1, X2, . . . , XN o tym samym roz-kładzie P gdzie n << N . Zakładamy, że ilość punktów n wSn jest znana. Proponowana metoda jest na tyle elastyczna,że zwiększenie n wykorzystuje wcześniej dokonane oblicze-nia. Proponowane jest łączne zastosowanie kilku znanychteorii i metod: metody wielowymiarowych kwantyli (Kolt-chinskii, Chaudhuri), odpornej metody ich estymacji używającM-estymatorów (Huber), interpretacji M-funkcjonałów jakokwantyli rozkładów zakłóconych (Pawlak, Kozek) oraz teo-rii równomiernych sekwencyjnych rozkładów punktów (lowdiscrepancy points (ldp), Woźniakowski, Chen i inni). Star-tując z n punktami ldp w kuli jednostkowej w Rk wybieramydo estymacji odpowiadające tym punktom n k-wymiarowekwantyle. Kwantyle te estymujemy odpornie (robust) przy po-mocy specjalnie dobranych M-estymatorów. Rezultatem jestestymator ’szkieletu’ składający się z n punktów oszczęd-nie aproksymujący wyjściowy k-wymiarowy rozkład. W pracybadamy asymptotyczne własności proponowanej metody.

Page 27: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 27

Powrót do indeksu abstraktów sekcji

Page 28: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 28

Two-step selection method for misspecified bi-nary regressionMariusz [email protected] Warszawska

Współautor:Jan [email protected] Warszawska

Rozważamy dwuetapową procedurę selekcji predyktoróww sytuacji, gdy model regresji binarnej:

P(Y = 1|X = x) = q(x) (1)

jest źle wyspecyfikowany, tj. q(x) = q(βT x) i odpowiada-jąca funkcja minus log-wiarogodności nie jest równa założo-nej funkcji straty ρ. Badamy problem znalezienia zgodnegoestymatora β parametru β∗ minimalizującego funkcję ryzyka:

R (b) = Eρ(bTX, Y )

dla b ∈ Rp. Celem selekcji w rozważanym przez nas pro-blemie jest znalezienie takiego wektora β , który ma taki samnośnik jak β∗ z wysokim prawdopodobieństwem. Propono-wana procedura składa się z odsiewania i porządkowaniapredyktorów przy użyciu metody Lasso w pierwszym kroku,a następnie wybrania zbioru minimalizującego UogólnioneKryterium Informacyjne w powstałej rodzinie modeli. Oma-wiamy warunki dostateczne zgodności wyboru predyktoróww tej procedurze.

Page 29: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 29

We consider two-stage selection procedure when the un-derlying binary regression model:

P(Y = 1|X = x) = q(x) (2)

is misspecified, ie. q(x) = q(βT x) and the corresponding mi-nus log-likelihood function is not equal considered loss func-tion ρ. We study a problem of finding consistent estimator βof the parameter β∗, which minimizes risk function:

R (b) = Eρ(bTX, Y )

for b ∈ Rp. The main aim of selection in the consideredproblem is to find vector β which recovers the support of β∗with high probability. Proposed procedure consists of scre-ening and ordering of predictors using Lasso method andthen selecting a subset of predictors which minimizes Ge-neralized Information Criterion on the corresponding nestedfamily. We discuss sufficient conditions for consistent selec-tion of predictors in this procedure.

Bibliografia[1] M. Kubkowski, J. Mielniczuk Selection consistency of

Lasso-based procedures for misspecified high-dimen-sional binary model and random regressors, arXiv pre-print arXiv:1906.04175, 2019.

[2] M. Kubkowski, Misspecification of binary regressionmodel: properties and inferential procedures, PhD the-sis (under review), 2019.

Powrót do indeksu abstraktów sekcji

Page 30: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 30

Limit theorems for empirical cluster functionalswith applications to statistical inferenceRafał [email protected] of Ottawa, Canada

Limit theorems for empirical cluster functionals are di-scussed. Conditions for weak convergence are provided interms of tail and spectral tail processes and can be veri-fied for a large class of multivariate time series, includinggeometrically ergodic Markov chains. Applications includeasymptotic normality of blocks and runs estimators for theextremal index and other cluster indices. Results for multi-plier bootstrap processes are also provided.

References[1] H. Drees, Limit theorems for empirical cluster functio-

nals, Annals of Statistics 38: 2145-2186 (2010).[2] R. Kulik, P. Soulier, O. Wintenberger, The tail empirical

process of regularly varying functions of geometricallyergodic Markov chains, Stochastic Processes and theirApplications (2019).DOI: https://doi.org/10.1016/j.spa.2018.11.014.

[3] R. Kulik, P. Soulier, Heavy Tailed Time Series, Sprin-ger, 2020.

Powrót do indeksu abstraktów sekcji

Page 31: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 31

Non-asymptotic Analysis of Biased StochasticApproximation SchemesBłażej [email protected] Warszawski

Stochastic approximation (SA) is a key method used instatistical learning. Recently, its non- asymptotic conver-gence analysis has been a fundamental issue considered inmany papers. However, most of these analyses are made un-der restrictive assumptions such as unbiased gradient es-timates and convex objective function, which significantly li-mit their applications to sophisticated tasks such as onlineand reinforcement learning. These restrictions are all essen-tially relaxed in this work. In particular, we consider twogeneral SA schemes to minimize a non-convex objective func-tion. We consider update procedure whose mean field is notnecessarily of gradient-type, covering in particular approxi-mate second-order method and allow the one-step updateto be a biased estimator of the target mean-field. We illu-strate these settings with the online EM algorithm and thepolicy-gradient method for average reward maximization inreinforcement learning.References

[1] B. Karimi, B. Miasojedow, E. Moulines, H.-T. Wai, Non-asymptotic Analysis of Biased Stochastic Approxima-tion Scheme, Proceedings of the Thirty-Second Confe-rence on Learning Theory, 1944–1974, 2019.

Powrót do indeksu abstraktów sekcji

Page 32: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 32

Poisson Tree MCMCWojciech [email protected] im. Mikołaja Kopernika w Toruniu

Co-authors:Tomasz Cąkał[email protected] WarszawskiBłażej [email protected] Warszawski

Poisson Tree MCMC algorithms belong to the family of“particle MCMC” (pMCMC) algorithms introduced by An-drieu et al. (JRSS (B) 2010), including particle Metropolis-Hastings and particle Gibbs Sampler. We introduced ver-sions of these algorithms in which the number of “children”of a particle at a given time has a Poisson distribution. Incontrast with the classical versions with deterministic num-ber of particles, Poisson Tree MCMC can be directly ap-plied to compute posterior distributions for continuous timesemi-Markov processes. We show that Poisson Tree MCMCalgorithms preserve the target (posterior) distribution on thespace of trajectories of the hidden process. We also provethat for discrete time models, Poisson Tree Gibbs Sampler isuniformly ergodic.

Another advantage of our scheme is that descendants ofdifferent particles can evolve independently. This makes iteasy to parallelize computations. Simulations show that this

Page 33: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 33

leads to a substantial gain in efficiency.References

[1] C. Andrieu, A. Doucet, R. Holenstein, Particle Markovchain Monte Carlo methods. Journal of the Royal Sta-tistical Society B, 2010

[2] F. Lindsten, M.I. Jordan, T.B. Schön, Particle Gibbs withAncestor Sampling, Journal of Machine Learning Re-search, 2014

Powrót do indeksu abstraktów sekcji

Page 34: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 34

Statistical Real-Time Tools for Exploring De-pendence in Multivariate Time SeriesHernando [email protected] Abdullah University of Science and Technology,Saudi Arabia

This work is motivated by the problem of characterizingmulti-scale changes in multivariate time series resulting froman external stimulus or shock to the system. One particulargoal is to develop a method that can track real-time changesin dependence. This talk will cover a quick overview of theclassical measures: coherence, partial coherence and dual-frequency coherence and then introduce some non-stationarygeneralizations of these (in particular, the evolutionary dual-frequency coherence). We then discuss partial directed cohe-rence which, unlike the previously mentioned measures, cancapture directionality between components under the frame-work of vector autoregressive processes. The latter part of thetalk will cover some of the real-time techniques for estima-ting the different measures of connectivity and for extractinglow-dimensional signal summaries. These methods will becritical for understanding biofeedback and adjusting the sti-muli adaptively during the experiment. These methods will beapplied to various brain signals to track dynamic changes inconnectivity in an experiment that seeks to find associationsbetween brain physiological signals and creative thinking.This is joint work with the Biostatistics Research Group atKAUST (Dr. Chee-Ming Ting and Marco Pinto).

Page 35: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 35

Powrót do indeksu abstraktów sekcji

Page 36: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 36

Metody najbliższego sąsiada w modelowaniupredykcyjnymMirosław [email protected] of Manitoba i Akademia Górniczo-Hutnicza

Metody najbliższego sąsiada są jednymi z najprostszychoraz intuicyjnie atrakcyjnych procedur stosowanych w nie-parametrycznym uczeniu oraz predykcji. Są one szczególnieprzydatne w sytuacjach, w których nieznana jest strukturadanych, a dane bezpośrednio decydują o jakości predykcji.Metody najbliższego sąsiada wymagają wyboru miary odle-głości i schematu ważenia. Wiele znanych algorytmów ucze-nia takich jak losowe lasy, AdaBoost czy gradient boostingmogą być postrzegane jako ważone metody najbliższego są-siada z prawidłowo wyuczoną funkcją odległości.W referacie omówię wykorzystanie metod najbliższego są-siada w kontekście nieparametrycznej analizy regresyjnej iszeregów czasowych. W szczególności, przedstawię wybraneklasy modeli nieparametrycznych i semi-parametrycznych dlaszeregów czasowych. Ponadto omawiany będzie problem nie-parametrycznego testowania modelu i przekleństwo wymiaruw przypadku danych wielowymiarowych.Bibliografia

[1] G. Biau and L. Devroye, Lectures on the Nearest Ne-ighbour Method, Springer-Verlag, Berlin, 2015.

[2] W. Greblicki and M. Pawlak, Nonparametric SystemIdentification, Cambridge University Press, Cambridge,2008.

Page 37: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 37

Powrót do indeksu abstraktów sekcji

Page 38: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 38

A novel weighted likelihood estimation with em-pirical Bayes flavorKrzysztof Podgó[email protected] University, Szwecja

We propose a novel approach to estimation, where a setof estimators of a parameter is combined into a weighted ave-rage to produce the final estimator. The weights are chosen tobe proportional to the likelihood evaluated at the estimators.We investigate the method for a set of estimators obtained byusing the maximum likelihood principle applied to each indi-vidual observation. The method can be viewed as a Bayesianapproach with a data driven prior distribution. We provideseveral examples illustrating the new method, and argue forits consistency, asymptotic normality, and efficiency. We alsoconduct simulation studies to assess the performance of theestimators. This straightforward methodology produces con-sistent estimators comparable with those obtained by themaximum likelihood method. The method also approximatesthe distribution of the estimator through the ‘posterior’ distri-bution. Many straightforward generalizations are suggestedand can be subject future studies. The talk is based on (Hos-sain et al. 2018) and provides an alternate estimation in thesingular cases of likelihood discussed in (Podgórski and Val-lin 2015).References

[1] Podgórski, K., Wallin, J. Maximizing leave-one-out li-kelihood for the location parameter of unbounded den-

Page 39: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 39

sities, Annals of the Institute of Statistical Mathematics67(1):19-38 (2015).

[2] Hossain, M., Kozubowski, T.J., Podgórski, K. A novelweighted likelihood estimation with empirical Bayesflavor, Communications in Statistics - Simulation andComputation 47(2): 392-412 (2018).

Powrót do indeksu abstraktów sekcji

Page 40: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 40

Geometria rozbicia MAP w bayesowskich mo-delach mieszanekŁukasz [email protected] Warszawski

Współautor: John NobleBayesowskie modele mieszanek stanowią jedno z narzę-

dzi do przeprowadzania analizy skupień. Ich istotą jest na-łożenie pewnego rozkładu prawdopodobieństwa (prawdopo-dobieństwo a priori) na możliwe rozbicia danych na grupyi oparciu wnioskowania o rozkład warunkowy (a posteriori),wykorzystując rozkład prawdopodobieństwa danych pod wa-runkiem rozbicia (rozkład próbkowy) oraz twierdzenie Bay-esa. W moich badaniach analizuję własności rozbicia maksy-malizującego prawdopodobieństwo a posteriori (tzw. rozbiciaMAP). W sytuacji, gdy rozkład próbkowy jest skonstruowanyprzy użyciu sprzężonych rodzin wykładniczych, dowolne dwiegrupy w estymatorze MAP są rozdzielone przez poziomniceliniowego funkcjonału statystyki dostatecznej. W szczegól-ności, gdy w ramach danej grupy dane losowane są z roz-kładu gaussowskiego o nieznanej średniej i macierzy kowa-riancji (losowanymi odpowiednio z rozkładów gaussowskiegoi Wisharta), oznacza to możliwość rozdzielenia dowolnychdwóch grup przez kwadrykę (powierzchnię określoną równa-niem drugiego stopnia). W przypadku, gdy wewnątrzgrupowamacierz kowariancji jest ustalona, grupy są rozdzielone przezhiperpłaszczyzny, co stanowi elegancki odpowiednik własno-ści regionów decyzyjnych w analizie dyskryminacyjnej Fi-

Page 41: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 41

shera.Bibliografia

[1] Ł. Rajkowski and J. Noble, A note on the geometry ofthe MAP partition in Conjugate Exponential BayesianMixture Models,arXiv preprint, arXiv:1902.01141v2 (2019).

Powrót do indeksu abstraktów sekcji

Page 42: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 42

A regression framework for multi-view analysisof high-dimensional structured dataTimothy [email protected] Hutchinson Cancer Center, Seattle, USA

The analysis of genomic and other ’omics data is oftencarried out from multiple perspectives. For example, one sam-ple from a microbiome study involves many microbial me-asurements, but these measures may take multiple forms(species abundance, species presence, microbe gene counts,etc) and have auxiliary information (phylogenetic related-ness, metabolic potential, etc). These multiple "viewsóf eachsample don’t fit neatly into standard statistical analyses ordimension-reduction methods. Here we present a frameworkof incorporating more than one view of such data into bothdimension-reduction methods and penalized regression mo-dels.

Powrót do indeksu abstraktów sekcji

Page 43: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 43

Szybka i odporna selekcja cech w modelach re-gresyjnychWojciech [email protected] im. Mikołaja Kopernika w Toruniu

Współautorka: Małgorzatą Bogdan (Uniwersytet Wro-cławski)Selekcja cech jest zagadnieniem ważnym, zwłaszcza gdy ba-damy wysokowymiarowe zbiory danych, w których liczbacech znacząco przekracza liczbę obserwacji. W wielu przy-padkach znalezienie małego zbioru złożonego z cech istot-nych jest równie ważne, bądź ważniejsze, jak poprawna es-tymacja czy predykcja.

Rozważamy problem selekcji cech w modeluYi = g(β ′Xi, εi), i = 1, . . . , n, gdzie Yi ∈ R jest zmiennązależną, Xi ∈ Rp wektorem cech, β prawdziwym parametremoraz εi błędem losowym. Zakładamy, że nieznana funkcja gjest rosnąca względem pierwszej zmiennej. Rozkład błędówεi jest dowolny, w szczególności nie wymagamy istnieniajego momentów.

Proponujemy prostą i obliczeniowo szybką procedurę se-lekcji cech, która oparta jest na standardowym algorytmieLasso ze zmiennymi Yi zastąpionymi przez ich rangi Ri. Przed-stawimy teoretyczne i numeryczne wyniki dotyczące zgodno-ści w wyborze modelu naszych metod. Zaproponowane roz-wiązania porównamy z procedurą LADLasso [1], która jestczęsto używanym narzędziem w odpornej selekcji cech.Bibliografia

Page 44: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 44

[1] J. Fan, Y. Fan and E. Barut, Adaptive robust variableselection, Ann. Statist., 42: 324–351 (2014).

Powrót do indeksu abstraktów sekcji

Page 45: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 45

Własności estymatorów w modelowaniu przy-czynowościKrzysztof Rudaś[email protected] Warszawska

Od kilku lat modelowanie przyczynowości staje się corazistotniejszą gałęzią statystki, wykorzystywaną między innymiw medycynie czy kampaniach marketingowych. Celem mode-lowania przyczynowości jest wskazanie elementów populacji(np. pacjentów) dla których nasze działanie (np. nowa te-rapia) daje pozytywne rezultaty. Aby uzyskać tę informację,porównuje się dwie sytuacje. Pierwsza, kiedy dany elementpopulacji został poddany działaniu i druga, kiedy nie został.Niestety nie posiadamy tych dwóch informacji jednocześnie.Problem ten rozwiązuje się, stosując podział całej populacjina zbiór eksperymentalny i kontrolny, a następnie estymującróżnicę zysku w tych dwóch sytuacjach.

W swojej prezentacji skupię się na założeniu liniowościodpowiedzi w obydwu grupach. Wówczas najpopularniejsząmetodą estymacji jest model podwójny. Metoda ta polegana konstrukcji dwóch estymatorów liniowych, odpowiedniona grupie eksperymentalnej i kontrolnej i policzenia różnicymiędzy nimi. W swoim wystąpieniu zaprezentuję metody al-ternatywne, a także porównam ich własności z modelem po-dwójnym.Bibliografia

[1] K. Rudaś and S. Jaroszewicz, Linear regression foruplift modeling, Data Mining and Knowledge Disco-

Page 46: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 46

very vol.32, num.5: 1275–1305 (2018).Powrót do indeksu abstraktów sekcji

Page 47: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 47

Zmienność średnich i kwantyli mieszanek upo-rządkowanych rozkładów przy niedokładnymwyborze rozkładu a prioriTomasz [email protected] akademia Nauk

Rozważamy rodziny rozkładów prawdopodobieństwa in-deksowane parametrami z przedziału osi rzeczywistej. Za-kładamy jedynie, że wzrost wartości parametru powodujewzrost rozkładu względem standardowego porządku stocha-stycznego. Badamy konsekwencje nieprecyzyjnego wyborurozkładu a priori na zbiorze parametrów modelu. Dokładniej,wybieramy ustalony rozkład a priori, podczas gdy rzeczywi-sty rozkład a priori należy do jego nieparametrycznego oto-czenia. Wówczas wyznaczamy optymalne dolne i górne osza-cowania różnic między wartościami oczekiwanymi i kwanty-lami mieszanek względem prawdziwego i założonego roz-kładu mieszającego w różnych jednostkach skali.

Powrót do indeksu abstraktów sekcji

Page 48: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 48

Zasada Morozowa dla poissonowskich proble-mów odwrotnychZbigniew [email protected] Górniczo-Hutnicza

Rozważymy problem odwrotnej estymacji funkcji inten-sywności procesu Poissona. Dla zaobserwowanego procesuPoissona (tzn. losowej miary punktowej) o funkcji intensyw-ności g = Kf , gdzie K jest pewnym zwartym operatoremdziałającym między pewnymi ośrodkowymi przestrzeniami Hil-berta, chcemy wyestymować funkcję f . Jest to ogólna po-stać tzw. poissonowskiego problemu odwrotnego, zwykle źlepostawionego w sensie Hadamarda. Jego rozwiązanie wy-maga zastosowania jakiejś formy regularyzacji i związanejz nią, opartej na danych metody wyboru parametru wygła-dzającego. Przedstawimy pewną ogólną konstrukcję metodywyboru parametru regularyzacji odpowiednią dla tego typuproblemów, a opartą na tzw. zasadzie rozbieżności Morozowa.W odróżnieniu od podobnych metod opisanych w literaturze,nie będzie potrzebna dyskretyzacja rozważanego problemu.Omówimy pewne własności asymptotyczne otrzymanych es-tymatorów i przykładowe zastosowania do problemów ste-reologicznych sformułowanych jako poissonowskie problemyodwrotne.

Powrót do indeksu abstraktów sekcji

Page 49: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 49

Classifier chains for multi-label classificationPaweł [email protected] Akademia Nauk

Multi-label classification (MLC) has received increasingattention in recent years, motivated by a large number ofnew applications. In MLC each object of our interest is de-scribed by a vector of features and a vector of binary labels.The main objective is to build a model which predicts la-bels using features. For example in medical diagnosis thegoal is to predict occurrences of diseases using some infor-mation about a patient. Classifier chains (CC) are among themost popular and successful methods used in MLC. The goalof the talk is to present various modifications of standardCC method, e.g. adaptive classifier chains (ACC) and parsi-monious classifier chains (parCC). The modifications aim tobuild powerful models under a constraint on the total num-ber of features. Reducing the number of features is crucialin the domains where the acquisition of the feature values iscostly, e.g. in medical diagnosis where each diagnostic testis associated with its cost.References

[1] P. Teisseyre, CCnet: Joint multi-label classification andfeature selection using classifier chains and elastic netregularization, Neurocomputing 235: 98–111 (2017).

[2] P. Teisseyre and D. Zufferey and M. Slomka, Cost-sensitive classifier chains: selecting low-cost featuresin multi-label classification, Pattern Recognition 86:

Page 50: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 50

290–319 (2019).Powrót do indeksu abstraktów sekcji

Page 51: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 51

Asymptotics of the overflow in urn modelsJacek Wesoł[email protected] Warszawska

The number of occupied urns after n balls have beenthrown in is often interpreted as a measure of richness. Indiversity analysis, the number Mk of urns with exactly kballs, is called abundance count of order k and a popularestimator of species richness, called Chao estimator, is basedon M1 and M2, Chao and Chiu (2016).

Balls (n of them) are to be placed into urns, each urn ofcapacity r . If the urn selected for the given ball is already full,the ball lands in the overflow. We study the size of the over-flow, Vn,r , when n → ∞. Hwang and Janson (2008) coveredthe Poissonian asymptotic of Vn,1. We establish Poissonianand Gaussian asymptotics of Vn,r for any r ≥ 1. Note thatthe abundance count, Mn,r , is the second discrete derivativeof Vn,r , i.e. its asymptotics can be read out from that of Vn,r .

The talk is based on Gouet, Hitczenko and Wesołowski(2019).References

[1] A. Chao , C.-H. Chiu, Species richness: estimation andcomparison, WileyStatsRef: Statistics Reference On-line: 126 (2016).

[2] R. Gouet, P. Hitczenko, J. Wesołowski, Asymptotics ofthe overflow in urn models, arXiv 1905.06663: 1–23(2019).

[3] H.K. Hwang, S. Janson, Local limit theorems for finite

Page 52: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 52

and infinite urn models, Ann. Probab. 36(3): 992-1022(2008).

Powrót do indeksu abstraktów sekcji

Page 53: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 53

Adaptacyjny jednostronny dwupróbkowy testKaplana-MeieraGrzegorz Wył[email protected] Wrocławski

W referacie przedyskutujemy istniejace podejścia, znane zliteratury, do detekcji stochastycznego uporzadkowania dwóchfunkcji przeżycia jak również postawimy i rozwiażemy nowa-torski problem testowania dotyczacy jego istnienia. Dokład-niej, hipoteza zerowa orzeka brak uporzadkowania, natomiastalternatywa wyraża jego istnienie. Wprowadzona statystykatestowa jest pewnym funkcjonałem standaryzowanego dwu-próbkowego procesu Kaplana-Meiera próbkowanego w loso-wej liczbie losowych punktów bedacych obserwowanymi cza-sami przeżycia w połaczonych próbach oraz wykorzystuje in-formacje zawarta w specjalnie do tego celu zdefiniowanej jed-nostronnej ważonej statystyce log-rank. Statystyka testowaautomatycznie waży wielkość i znak bloków ja budujacychstajac sie przez to czuła procedura w rozważanym problemietestowania. Adaptacyjna konstrukcja sprawia, że odpowia-dajacy jej test kontroluje asymptotyczne błedy obu rodzajówna ustalonym poziomie istotności α . Przeprowadzone bada-nia symulacyjne pokazuja, że błedy te sa kontrolowane w sa-tysfakcjonujacym stopniu również gdy liczba obserwacji jestskończona. Na tle najlepszych i najpopularniejszych testównowe rozwiazanie wypada bardzo dobrze. Analiza zbioru da-nych rzeczywistych potwierdza te konkluzje.Bibliografia

Page 54: statystyka - Jagiellonian University · temporal processes that are locally time-harmonizable. Our bootstrap-based methodology estimates confidence intervals for both the spatial

STATYSTYKA 54

[1] G. Wyłupek, Data-driven Kaplan-Meier one-sided two-sample tests, Under review, (2019)

Powrót do indeksu abstraktów sekcji